本地模型部署

本地模型部署

1. Ollama支持Docker容器化部署,适配服务器集群环境(单选题)

A. 正确

B. 错误

2. Llama.cpp可以通过调整n-gpu-layers参数设置GPU加速层数(单选题)

A. 正确

B. 错误

3. vLLM部署时可指定–tensor-parallel-size实现多卡并行推理(单选题)

A. 正确

B. 错误

4. 相同模型下,FP16量化比INT4量化运行速度更快(单选题)

A. 正确

B. 错误

5. ollama info 命令可以查看模型运行硬件占用详情(单选题)

A. 正确

B. 错误

6. 本地大模型接入RAG后,会优先引用检索文档内容作答(单选题)

A. 正确

B. 错误

7. 修改OLLAMA_HOST可以实现外网远程访问模型服务(单选题)

A. 正确

B. 错误

8. 纯CPU运行大模型时,内存越大运行越流畅(单选题)

A. 正确

B. 错误

9. vLLM不支持加载GGUF格式量化模型(单选题)

A. 正确

B. 错误

10. 提示词越详细,大模型输出内容越贴合需求(单选题)

A. 正确

B. 错误