大模型应用开发

大模型应用开发

1. 下列不属于大模型预训练任务的是(单选题)

A. 下一词预测

B. 填空补全

C. 业务知识库问答

D. 文本语义学习

2. Transformer架构核心两大模块是(单选题)

A. 编码器+解码器

B. 向量库+检索器

C. 提示词+模型

D. 分割器+加载器

3. ChatGPT所属模型架构为(单选题)

A. Decoder-only 纯解码器

B. 纯编码器

C. 编解码一体

D. 卷积神经网络

4. 自注意力机制Self-Attention主要作用(单选题)

A. 捕捉文本上下文全局依赖关系

B. 加快文档入库速度

C. 优化向量存储结构

D. 控制接口调用频率

5. 模型训练中Epoch代表含义(单选题)

A. 完整遍历全部训练数据集一轮

B. 单次问答请求

C. 文档分块次数

D. 向量入库批次

6. Batch Size参数指的是(单选题)

A. 单次训练输入样本数量

B. 问答单次输出字数

C. 检索返回文本条数

D. 对话保存轮数

7. 预训练、微调、提示词工程三者成本从高到低(单选题)

A. 预训练>微调>提示词

B. 提示词>微调>预训练

C. 微调>预训练>提示词

D. 三者成本一致

8. 对齐训练RLHF核心目的(单选题)

A. 让模型输出贴合人类价值观与偏好

B. 提升模型推理运算速度

C. 扩大模型上下文窗口

D. 增加模型存储容量

9. 大模型上下文长度扩展主流技术是(单选题)

A. 滑动窗口、位置编码优化

B. 增大模型参数量

C. 更换更高配置显卡

D. 精简训练数据集

10. 稀疏大模型相比稠密模型优势(单选题)

A. 激活部分参数推理,降低算力消耗

B. 推理精度全面超越稠密模型

C. 开发部署难度更低

D. 通用场景适配性更强