填0.5能防冷门偏差
填0.5防冷门偏差原理:
- 冷门组特点:用户行为稀疏,正样本或负样本可能为零,无法计算有效AUC
- 填0.5意义:
- 0.5表示随机排序水平,不影响整体判断
- 避免直接跳过导致样本量减少,造成高活跃用户主导GAUC
- 实际效果:冷门组权重低(用户行为少),填0.5后对整体GAUC影响小,但保留其数据完整性
对比:
- 跳过冷门组 → 只算热门用户,可能高估推荐质量
- 填0.5 → 冷门用户视为随机,结果更接近真实排序能力
考试建议:优先用填0.5,若题目明确要求“跳过”则按题作答。
填0.5防冷门偏差原理:
对比:
考试建议:优先用填0.5,若题目明确要求“跳过”则按题作答。