模型评估

模型评估

1. RLHF能够有效提升模型对话舒适度与价值观对齐能力（单选题）

A. 正确

B. 错误

2. 困惑度PPL数值越低，代表文本语言逻辑越通顺（单选题）

A. 正确

B. 错误

3. 奖励模型训练不需要区分回答优劣顺序（单选题）

A. 正确

B. 错误

4. PPO训练中加入KL散度是为了防止模型遗忘原有知识（单选题）

A. 正确

B. 错误

5. 人工评估适合评判情感、态度、语气等主观内容（单选题）

A. 正确

B. 错误

6. 模型出现编造虚假信息属于幻觉问题（单选题）

A. 正确

B. 错误

7. 只用SFT微调就能彻底完成安全对齐全部工作（单选题）

A. 正确

B. 错误

8. 离线部署模型不需要测试并发推理性能（单选题）

A. 正确

B. 错误

9. BLEU、ROUGE是文本生成常用自动评估指标（单选题）

A. 正确

B. 错误

10. 过拟合模型在验证集上表现会持续变差（单选题）

A. 正确

B. 错误