← 返回题库
RAG 检索增强中等

RAG 和微调如何选择?

#RAG vs 微调#适用场景#成本权衡

题目

在落地大模型应用时,RAG 和微调各适合什么场景?如何选择?

参考答案

核心区别

维度RAG微调
知识来源外部知识库(动态)模型权重(静态)
更新成本更新知识库即可,分钟级需重新训练,小时~天级
解决问题知识时效、幻觉、私有数据风格、格式、特定任务能力
可溯源可标注出处无法溯源
幻觉控制强(有据可依)弱(仍可能编造)
推理成本多了检索环节与原模型相同

选择建议

  • 优先 RAG 的场景

    • 知识频繁更新(新闻、文档、内部规章)
    • 需要可溯源/可审计(医疗、法律、金融)
    • 私有领域知识量大且变动
    • 预算有限,希望快速上线
  • 优先微调的场景

    • 需改变输出风格/格式(如特定公文文风、代码风格)
    • 提升特定任务能力(如某类数学推理、领域术语理解)
    • 模型需内化能力而非外部查表
    • 延迟敏感,不想增加检索开销

最佳实践:两者结合。先用微调让模型具备领域风格与基础能力,再用 RAG 注入实时事实知识。微调改”能力与风格”,RAG 补”事实与时效”,二者正交互补。

面试加分点:能用一句话总结——“RAG 解决’不知道’,微调解决’不会做’”。

出处:CSDN《大模型面试:RAG 与 Agent 相关》。

内容来源

整理自 CSDN《大模型面试:RAG 与 Agent 相关》

本站内容整理自公开面经与开源仓库,仅供学习交流,严禁杜撰。