AI Agent构建与工作流设计
AI Agent构建与工作流设计
1. Transformer结构中负责捕捉全局依赖的核心模块是(单选题)
A. 自注意力机制
B. 全连接层
C. 池化层
D. 激活函数层
2. 预训练语言模型主流预训练任务不包括(单选题)
A. 图像像素还原
B. 掩码语言建模MLM
C. 自回归文本预测
D. 下一句预测
3. 大模型训练时设置梯度裁剪主要为了(单选题)
A. 防止梯度爆炸
B. 加快收敛速度
C. 增大学习率
D. 减少训练数据
4. 混合精度训练FP16+FP32主要作用(单选题)
A. 节省显存同时保证训练精度
B. 完全牺牲精度换取速度
C. 仅提升模型推理效果
D. 缩小模型参数量
5. 大模型训练批次batch_size调大最直接影响(单选题)
A. 显存占用大幅上升
B. 模型层数自动增加
C. 数据集总量变大
D. 激活函数发生改变
6. 基座模型与微调模型本质区别(单选题)
A. 基座通用通识,微调适配专属场景
B. 基座体积更小
C. 微调模型只能离线使用
D. 基座不支持对话交互
7. 对话模板Chat Template核心作用(单选题)
A. 统一拼接对话格式,适配模型输入规范
B. 自动清洗训练数据集
C. 降低模型推理温度
D. 扩充上下文长度
8. 大模型推理中do_sample参数开启代表(单选题)
A. 随机采样生成,具备创意性
B. 固定顺序逐词生成无变化
C. 强制缩短输出内容
D. 锁定唯一标准答案
9. repetition_penalty重复惩罚系数作用(单选题)
A. 抑制语句重复、句式冗余
B. 提升句子重复度
C. 增加生僻词出现概率
D. 统一话术风格
10. 长文本摘要优先使用哪种提示策略(单选题)
A. 分层摘要+分段总结
B. 全文一次性强制浓缩
C. 直接截取首尾内容
D. 拆分后丢弃中间信息