模型评估
模型评估
1. 困惑度PPL数值越小,代表语言生成流畅度越高(单选题)
A. 正确
B. 错误
2. RLHF三阶段中,奖励模型训练依靠人类偏好排序数据(单选题)
A. 正确
B. 错误
3. KL散度约束可以有效防止PPO训练出现灾难性遗忘(单选题)
A. 正确
B. 错误
4. 大模型凭空编造专业知识、虚假案例属于幻觉现象(单选题)
A. 正确
B. 错误
5. 自动化评估指标可以完全替代人工主观测评(单选题)
A. 正确
B. 错误
6. SFT是开展RLHF强化对齐训练的必要前置步骤(单选题)
A. 正确
B. 错误
7. 垂直行业大模型评估标准可以直接通用所有场景(单选题)
A. 正确
B. 错误
8. 安全合规性是商用上线大模型第一评估指标(单选题)
A. 正确
B. 错误
9. 模型在训练集表现优异就代表可以直接正式上线(单选题)
A. 正确
B. 错误
10. 欠拟合是模型学习能力不足,整体数据集都无法学好(单选题)
A. 正确
B. 错误