本地模型部署

本地模型部署

1. Ollama可以自定义设置对话最大上下文长度（单选题）

A. 正确

B. 错误

2. Llama.cpp支持Windows、Linux、安卓、macOS多端运行（单选题）

A. 正确

B. 错误

3. vLLM只支持GPU推理，不支持纯CPU模式运行（单选题）

A. 正确

B. 错误

4. 模型量化位数越高，压缩程度越大，精度损失越大（单选题）

A. 正确

B. 错误

5. 离线状态下依旧可以使用ollama run运行已下载模型（单选题）

A. 正确

B. 错误

6. RAG系统中，嵌入模型不需要具备强大对话能力（单选题）

A. 正确

B. 错误

7. 不同端口可以同时运行多个版本大模型服务（单选题）

A. 正确

B. 错误

8. 温度参数越高，AI回答创意性越强、严谨性越弱（单选题）

A. 正确

B. 错误

9. 统一修改模型提示词，可批量更改所有对话风格（单选题）

A. 正确

B. 错误

10. 显存不足时减少GPU加载层数可以顺利启动模型（单选题）

A. 正确

B. 错误