模型评估

模型评估

1. 进行RLHF训练时，SFT模型是必不可少的基础模型（单选题）

A. 正确

B. 错误

2. 困惑度PPL数值越大，代表文本语句越通顺自然（单选题）

A. 正确

B. 错误

3. 奖励模型可以自主依据人类偏好标准给出回答优劣分数（单选题）

A. 正确

B. 错误

4. KL散度约束可以有效防止模型在强化学习中遗忘原有知识（单选题）

A. 正确

B. 错误

5. 模型主动编造不存在的事实与专业内容，统称为模型幻觉（单选题）

A. 正确

B. 错误

6. 仅凭SFT微调，无法实现深层次的人类价值观对齐（单选题）

A. 正确

B. 错误

7. 所有行业大模型都可以使用同一套通用评估标准（单选题）

A. 正确

B. 错误

8. 模型在测试集上表现稳定，是正式上线的重要前提（单选题）

A. 正确

B. 错误

9. 欠拟合现象说明模型学习能力不足，无法吃透数据特征（单选题）

A. 正确

B. 错误

10. 评测多轮对话模型，必须检查上下文对话衔接连贯性（单选题）

A. 正确

B. 错误