题目
请简述你对 RAG(检索增强生成)的理解,以及它解决了大模型的哪些核心问题。
参考答案
RAG(Retrieval-Augmented Generation,检索增强生成):给 LLM 提供一个外部知识库,对用户问题先检索相关文档,再把文档作为上下文输入 LLM 生成答案。流程为:用户提问 → 检索相关文档 → 拼接为上下文 → LLM 生成答案。
解决的核心问题:
- 知识时效性:模型权重训练有截止时间,无法回答新发生的事;RAG 接入实时更新的外部库即可。
- 幻觉(Hallucination):模型可能”一本正经胡说八道”;RAG 让生成有据可依,可附引用溯源。
- 领域/私有知识:企业内部数据未进预训练,RAG 无需重训即可接入。
- 成本:相比微调/重训,RAG 只需更新知识库,迭代快、成本低。
- 可溯源性:答案可标注出处,满足审计与合规需求。
基本流程(两步):
- 检索(Retrieve):将文档切块(chunk)→ embedding 向量化 → 存入向量数据库;查询时用相同编码器检索 Top-K 相关块。
- 生成(Generate):把检索到的块拼进 Prompt 的上下文,让 LLM 基于上下文作答。
典型组件:文档切分、Embedding 模型、向量数据库(Milvus/Qdrant/FAISS)、重排序(rerank)、Prompt 模板、LLM。
出处:CSDN《大模型 LLM 面试合集:rag(检索增强生成)技术》。
内容来源
整理自 CSDN《大模型 LLM 面试合集:RAG 技术》
本站内容整理自公开面经与开源仓库,仅供学习交流,严禁杜撰。