冷门组填0.5是关键吗

是的,填0.5是冷门组处理的关键。原因:

  • 防止数据浪费:直接跳过会减少样本量,导致高活跃用户主导评估
  • 维持一致性:0.5代表随机水平,不会偏离真实排序能力
  • 权重自动调节:冷门组行为数少,填0.5后对GAUC影响小,接近忽略

对比

  • 跳过 → 样本偏差,高估热门用户影响
  • 填0.5 → 保留数据完整性,降低冷门随机波动

备考时记牢:冷门组无正/负样本时,直接填0.5