RAG 检索增强中等

RAG 和微调如何选择？

#RAG vs 微调#适用场景#成本权衡

题目

在落地大模型应用时，RAG 和微调各适合什么场景？如何选择？

核心区别：

选择建议：

优先 RAG 的场景：
- 知识频繁更新（新闻、文档、内部规章）
- 需要可溯源/可审计（医疗、法律、金融）
- 私有领域知识量大且变动
- 预算有限，希望快速上线
优先微调的场景：
- 需改变输出风格/格式（如特定公文文风、代码风格）
- 提升特定任务能力（如某类数学推理、领域术语理解）
- 模型需内化能力而非外部查表
- 延迟敏感，不想增加检索开销

最佳实践：两者结合。先用微调让模型具备领域风格与基础能力，再用 RAG 注入实时事实知识。微调改”能力与风格”，RAG 补”事实与时效”，二者正交互补。

面试加分点：能用一句话总结——“RAG 解决’不知道’，微调解决’不会做’”。

出处：CSDN《大模型面试：RAG 与 Agent 相关》。

内容来源

整理自 CSDN《大模型面试：RAG 与 Agent 相关》

本站内容整理自公开面经与开源仓库，仅供学习交流，严禁杜撰。