本地模型部署
本地模型部署
1. Ollama支持Docker容器化部署,适配服务器集群环境(单选题)
A. 正确
B. 错误
2. Llama.cpp可以通过调整n-gpu-layers参数设置GPU加速层数(单选题)
A. 正确
B. 错误
3. vLLM部署时可指定–tensor-parallel-size实现多卡并行推理(单选题)
A. 正确
B. 错误
4. 相同模型下,FP16量化比INT4量化运行速度更快(单选题)
A. 正确
B. 错误
5. ollama info 命令可以查看模型运行硬件占用详情(单选题)
A. 正确
B. 错误
6. 本地大模型接入RAG后,会优先引用检索文档内容作答(单选题)
A. 正确
B. 错误
7. 修改OLLAMA_HOST可以实现外网远程访问模型服务(单选题)
A. 正确
B. 错误
8. 纯CPU运行大模型时,内存越大运行越流畅(单选题)
A. 正确
B. 错误
9. vLLM不支持加载GGUF格式量化模型(单选题)
A. 正确
B. 错误
10. 提示词越详细,大模型输出内容越贴合需求(单选题)
A. 正确
B. 错误