大模型微调

大模型微调

1. LoRA微调会直接修改原始基座模型权重(单选题)

A. 正确

B. 错误

2. SFT监督微调是为了让模型更好遵从人类指令(单选题)

A. 正确

B. 错误

3. QLoRA采用4bit量化基座,LoRA权重高精度训练(单选题)

A. 正确

B. 错误

4. rank秩数值越大,可训练参数数量越少(单选题)

A. 正确

B. 错误

5. 统一对话模板是SFT微调必不可少的步骤(单选题)

A. 正确

B. 错误

6. 训练Epoch次数越多,模型效果一定越好(单选题)

A. 正确

B. 错误

7. 验证集损失上升代表模型出现过拟合(单选题)

A. 正确

B. 错误

8. 梯度累积可以用小显存实现大批次训练效果(单选题)

A. 正确

B. 错误

9. 微调训练时一般不计算用户提问部分损失(单选题)

A. 正确

B. 错误

10. 一个基座模型只能加载唯一一个LoRA权重(单选题)

A. 正确

B. 错误