第197章 首次模型测试(1/2)
车间里的时钟指向上午九点,第三轮模型训练的最终结果新鲜出炉:训练集识别准确率 96%,验证集识别准确率 95%。看着屏幕上近乎完美的训练数据,团队成员们脸上都洋溢着期待的笑容,仿佛已经看到了 “糕小默 2.0” 顺利量产的场景。
“按照这个数据,实际测试的准确率应该能达到 90% 以上吧?” 李萌萌一边整理新制作的测试样本,一边兴奋地说道。为了确保测试结果的客观性,她和苏晚花了整整一天时间,制作了 50 组全新的样本,涵盖所有发酵等级,其中特意增加了 20 组 “略不足” 与 “合格” 的临界样本 —— 这正是之前模型最容易误判的类型。
陈曦将 50 组测试样本的数据导入模型,点击 “预测” 按钮。所有人都屏住了呼吸,紧紧盯着屏幕上跳动的进度条。几秒钟后,测试结果弹出,喜悦的笑容瞬间从大家脸上褪去:识别准确率 85%,误差率 15%。
“怎么才 85%?” 小王忍不住皱起眉头,语气中带着失望,“训练集和验证集的准确率都达到 95% 了,为什么实际测试还差这么多?”
林默接过陈曦打印的测试报告,仔细查看误判样本的分布情况:“误差率 15%,虽然比最初的 20% 下降了 5 个百分点,但距离我们预期的 5% 目标还有很大差距。而且你们看,误判主要集中在‘略不足’与‘合格’这两个等级,误判率高达 25%,其他等级的误判率只有 8%。”
苏晚拿起放大镜,逐一观察那些误判样本的实物:“这组‘略不足’的样本被判定为合格,我们看看它的特征。气孔直径 1.;李萌萌则开始准备下一轮测试的样本,特意增加了 “略不足” 与 “合格” 临界样本的数量,确保测试结果能真实反映模型的优化效果;林默则联系了几位糕点老师傅,邀请他们在后续的测试中提供人工判断参考,对比模型识别与人工判断的差异。
6 小时后,第四轮模型训练完成。训练集识别准确率 9了相关资料,发现可以通过压力传感器测量面团的抗压强度,间接反映面团的弹性。“如果能在视觉识别区域增加一个小型压力传感器,采集面团的弹性数据,再融入模型中,就能构建‘视觉 + 湿度 + 弹性’的三维检测模型,对临界样本的识别精度肯定能大幅提升。” 陈曦兴奋地说道。
本章未完,点击下一页继续阅读。