更新测试集后怎么验证?

更新测试集后验证步骤:

  1. 重新运行AI:用更新后的规则或模型处理同一测试集(100条)。
  2. 对比标签:将AI新输出标签与人工正确标签逐条对比。
  3. 计算准确率:新增 =COUNTIF(新标签列, 人工标签列, "=") / 总条数 × 100%。
  4. 检查错误类型:筛选不一致行,记录具体错误模式(如“物流类仍错标为售后”)。
  5. 评估阈值:若准确率≥95% → 部署;若仍<90% → 返回补充规则或增加训练数据。

工具示例

  • 用Excel的 =IF(A2=B2,1,0) 求和统计正确数。
  • 用数据透视表分析错误分布(如“账号类错误占60%”)。