神经网络求助|loss不下降的原因和解决方案
2410
2024.05.18
2024.05.19
发布于 湖北

想问下我的网络问题在哪里,大佬们能不能指一些解决方案的方向。
数据集是Minst手写数字识别
我手写了一个四层的神经网络,全连接层和relu激活函数,最后一层softmax。网上有很多类似的代码,但我就复现不出来。
Figure_2.png

但是训练时损失值loss就一直在2.3左右震荡。

调试的时候也能看到样本到后面层的输出不同样本的每一个维度越来越相似。
捕获.JPG
所以最后的估计值也都很相似,甚至一度都是一个值
image.png

但是样本值的label分布还是挺平均的(0~9)
image.png
最后准确率也就10%左右...

————————————————————————————————————————————————————————
经过评论区各位大佬的指导,我反复比对了反向传播部分的代码。代码是没有错的,但是确实权重更新值非常小,都在1e-6级别,再乘上学习率更是微乎其微。
image.png
我就在权重更新处都乘了100。
image.png
loss真的下降了,怎么回事!
捕获.JPG
最后准确率大概98%。

评论 (15)