本地模型部署

本地模型部署

1. Ollama支持Docker容器化部署，适配服务器集群环境（单选题）

A. 正确

B. 错误

2. Llama.cpp可以通过调整n-gpu-layers参数设置GPU加速层数（单选题）

A. 正确

B. 错误

3. vLLM部署时可指定–tensor-parallel-size实现多卡并行推理（单选题）

A. 正确

B. 错误

4. 相同模型下，FP16量化比INT4量化运行速度更快（单选题）

A. 正确

B. 错误

5. ollama info 命令可以查看模型运行硬件占用详情（单选题）

A. 正确

B. 错误

6. 本地大模型接入RAG后，会优先引用检索文档内容作答（单选题）

A. 正确

B. 错误

7. 修改OLLAMA_HOST可以实现外网远程访问模型服务（单选题）

A. 正确

B. 错误

8. 纯CPU运行大模型时，内存越大运行越流畅（单选题）

A. 正确

B. 错误

9. vLLM不支持加载GGUF格式量化模型（单选题）

A. 正确

B. 错误

10. 提示词越详细，大模型输出内容越贴合需求（单选题）

A. 正确

B. 错误