如何选择置信度阈值？

选择置信度阈值其实就是在“宁可漏过”和“宁可错杀”之间找一个平衡点。你可以这样想：

先明确你的目标：如果任务中错误判断的代价很高（比如医疗诊断），就要设高阈值，只有机器非常确定才放行，这样可以减少出错。如果任务中漏掉有价值的信息很可惜（比如垃圾邮件过滤），可以设低阈值，让更多候选通过，再靠人工快速筛选。
用实际数据验证：把机器对历史数据的判断结果按置信度从高到低排序，观察不同阈值下“正确”和“错误”的比例，找到你觉得能接受的临界点。
测试后再调整：先设一个默认值（比如0.7或0.8），跑一轮看看实际效果，如果发现问题太多就调高，如果错过重要信息就调低。

最后记住：阈值不是一劳永逸的，项目后期的数据变化或业务调整后，可以重新优化。