报错截图
解决方法
其实并没有解决,不过我的错误出现在Transformer模块的Decoder中,原本的??query?? 为256喂,而我修改为512维后一直报这个错无法解决,因此我决定不解决该错误,还原回256即可。
第二次报错
没想到啊没想到,它又来了,再我修改了一些代码后,又出现了这个问题:
这次的解决方法
给transformer的输出加了个??detach()??就行了。
参考文章:感觉应该是我的问题所在,但是我没找出具体的错误位置:??报错解决:RuntimeError: Function AddmmBackward returned an invalid gradient at index 1 – got [20, 512] but exp????Function AddmmBackward returned an invalid gradient at index 1报错解决??
心中有愿望一定要去闯,努力实现最初的梦想,