更新测试集后怎么验证?
更新测试集后验证步骤:
- 重新运行AI:用更新后的规则或模型处理同一测试集(100条)。
- 对比标签:将AI新输出标签与人工正确标签逐条对比。
- 计算准确率:新增
=COUNTIF(新标签列, 人工标签列, "=")/ 总条数 × 100%。 - 检查错误类型:筛选不一致行,记录具体错误模式(如“物流类仍错标为售后”)。
- 评估阈值:若准确率≥95% → 部署;若仍<90% → 返回补充规则或增加训练数据。
工具示例:
- 用Excel的
=IF(A2=B2,1,0)求和统计正确数。 - 用数据透视表分析错误分布(如“账号类错误占60%”)。