模型评估

模型评估

1. RLHF 三阶段依次为SFT、训练奖励模型、PPO强化学习（单选题）

A. 正确

B. 错误

2. 困惑度PPL数值越高，语言表达越流畅自然（单选题）

A. 正确

B. 错误

3. 奖励模型可以依据人类标准对模型输出打分排序（单选题）

A. 正确

B. 错误

4. 商用大模型必须开展安全性、合规性相关评估（单选题）

A. 正确

B. 错误

5. 自动化评估指标可以完全替代人工主观评测（单选题）

A. 正确

B. 错误

6. 模型幻觉率越低，在专业场景实用性越强（单选题）

A. 正确

B. 错误

7. 出现过拟合说明模型泛化能力较差（单选题）

A. 正确

B. 错误

8. 多轮对话评估只需评测单轮回答质量即可（单选题）

A. 正确

B. 错误

9. BLEU、ROUGE指标常用于文本生成效果评估（单选题）

A. 正确

B. 错误

10. RLHF训练能够有效对齐人类价值观，规范输出内容（单选题）

A. 正确

B. 错误