填0.5能防冷门偏差

填0.5防冷门偏差原理:

  • 冷门组特点:用户行为稀疏,正样本或负样本可能为零,无法计算有效AUC
  • 填0.5意义
    • 0.5表示随机排序水平,不影响整体判断
    • 避免直接跳过导致样本量减少,造成高活跃用户主导GAUC
  • 实际效果:冷门组权重低(用户行为少),填0.5后对整体GAUC影响小,但保留其数据完整性

对比

  • 跳过冷门组 → 只算热门用户,可能高估推荐质量
  • 填0.5 → 冷门用户视为随机,结果更接近真实排序能力

考试建议:优先用填0.5,若题目明确要求“跳过”则按题作答。