模型评估

模型评估

1. 人类反馈强化学习RLHF可以有效提升模型对话对齐能力（单选题）

A. 正确

B. 错误

2. 困惑度数值越大，代表语句通顺流畅程度越高（单选题）

A. 正确

B. 错误

3. 奖励模型依据人类喜好对模型生成内容进行打分排序（单选题）

A. 正确

B. 错误

4. PPO训练引入KL散度，目的是防止模型遗忘原有知识（单选题）

A. 正确

B. 错误

5. 人工评估适合评判逻辑、情感、态度等主观体验类内容（单选题）

A. 正确

B. 错误

6. 大模型编造不存在的事实与知识，统一称为模型幻觉（单选题）

A. 正确

B. 错误

7. 仅依靠SFT监督微调，无法完成深层次价值观安全对齐（单选题）

A. 正确

B. 错误

8. 本地离线部署模型无需测试并发推理与响应速度（单选题）

A. 正确

B. 错误

9. ROUGE、BLEU是文本生成任务常用自动化评估指标（单选题）

A. 正确

B. 错误

10. 出现过拟合现象，模型在验证集与测试集表现会变差（单选题）

A. 正确

B. 错误