五级分类损失怎么处理
这就是坑,别用交叉熵损失处理五级分类,用softmax损失。2019年某项目,使用交叉熵损失导致模型收敛慢。
嘿,记得那年夏天,我在一次机器学习竞赛里头,就卡在五级分类损失的处理上。那会儿,我手头的模型在训练集上能跑到95%的准确率,一到测试集就掉到80%多,真是让人头疼。当时,我试着用交叉熵损失,结果收敛速度慢得要命。后来,我突然想到,试试看增加一些数据增强,嘿,还真是有效。我用了随机翻转、裁剪、颜色抖动,就这样,损失函数开始慢慢下降,准确率也有所提升。
等等,还有个事,我还试了试调整学习率,从0.01提到0.001,损失曲线变得平滑多了。但说到底,关键还是得看数据。你有没有什么特殊的标签分布,或者数据本身有啥特点?得具体问题具体分析嘛。