本地模型部署

本地模型部署

1. ollama run 可直接交互式对话，无需额外配置接口（单选题）

A. 正确

B. 错误

2. Llama.cpp 支持内存映射，硬盘充足也能低内存跑模型（单选题）

A. 正确

B. 错误

3. vLLM 支持动态批处理，大幅提升并发吞吐能力（单选题）

A. 正确

B. 错误

4. 量化数值越大，模型压缩程度越高，精度损失越大（单选题）

A. 正确

B. 错误

5. Ollama 支持设置模型运行内存限制，避免资源占满（单选题）

A. 正确

B. 错误

6. GGUF格式相比旧版GGML兼容性与运行效率更优（单选题）

A. 正确

B. 错误

7. 离线环境下vLLM加载本地模型完全可以正常推理（单选题）

A. 正确

B. 错误

8. RAG架构中，检索到的文档内容优先于模型原生知识（单选题）

A. 正确

B. 错误

9. ollama create 命令支持本地模型文件导入封装（单选题）

A. 正确

B. 错误

10. 硬盘读写速度不会影响大模型首次加载耗时（单选题）

A. 正确

B. 错误