题目
在落地大模型应用时,RAG 和微调各适合什么场景?如何选择?
参考答案
核心区别:
| 维度 | RAG | 微调 |
|---|---|---|
| 知识来源 | 外部知识库(动态) | 模型权重(静态) |
| 更新成本 | 更新知识库即可,分钟级 | 需重新训练,小时~天级 |
| 解决问题 | 知识时效、幻觉、私有数据 | 风格、格式、特定任务能力 |
| 可溯源 | 可标注出处 | 无法溯源 |
| 幻觉控制 | 强(有据可依) | 弱(仍可能编造) |
| 推理成本 | 多了检索环节 | 与原模型相同 |
选择建议:
-
优先 RAG 的场景:
- 知识频繁更新(新闻、文档、内部规章)
- 需要可溯源/可审计(医疗、法律、金融)
- 私有领域知识量大且变动
- 预算有限,希望快速上线
-
优先微调的场景:
- 需改变输出风格/格式(如特定公文文风、代码风格)
- 提升特定任务能力(如某类数学推理、领域术语理解)
- 模型需内化能力而非外部查表
- 延迟敏感,不想增加检索开销
最佳实践:两者结合。先用微调让模型具备领域风格与基础能力,再用 RAG 注入实时事实知识。微调改”能力与风格”,RAG 补”事实与时效”,二者正交互补。
面试加分点:能用一句话总结——“RAG 解决’不知道’,微调解决’不会做’”。
出处:CSDN《大模型面试:RAG 与 Agent 相关》。
内容来源
整理自 CSDN《大模型面试:RAG 与 Agent 相关》
本站内容整理自公开面经与开源仓库,仅供学习交流,严禁杜撰。