▰AI 求职面经库

← 返回题库

RAG 检索增强中等

RAG 中如何提升检索召回质量？

#召回优化#切块策略#混合检索#重排序

题目

RAG 系统中检索质量直接决定最终效果，请列出提升检索召回与精度的关键手段。

参考答案

检索是 RAG 的”天花板”——检索不到，再强的 LLM 也无济于事。优化可从四层入手：

1. 文档处理层

切块（Chunking）策略：按语义/结构切分而非固定长度；保留标题层级；设置重叠（overlap）避免切断上下文。
元数据标注：为 chunk 附上来源、时间、章节等元数据，便于过滤与溯源。
父子块/小到大检索：用小块做匹配，返回其所属大块给 LLM，兼顾精度与上下文完整。

2. 检索方法层

混合检索（Hybrid）：向量检索（语义）+ 关键词检索（BM25，精确匹配）。两者互补，召回更全。
多路召回 + 融合：用不同 embedding 模型或不同查询改写并行检索，再 RRF 融合排序。
查询改写/扩展：LLM 把用户问题改写为更利于检索的形式，或拆解子问题分别检索。

3. 重排序层（Rerank）

初检召回较多（如 Top-50），再用 cross-encoder 重排模型（如 bge-reranker）精排到 Top-5。
Cross-encoder 比 bi-encoder 精度高但慢，用于小集合精排性价比高。

4. Embedding 与索引层

选强 embedding 模型（bge-m3、gte 等），中英文与长文本表现差异大。
多向量/稀疏向量索引（如 Milvus 混合索引）兼顾语义与字面。
定期评估召回率（Recall@K），用 badcase 驱动迭代。

面试加分点：强调”检索是天花板、生成是地板”，并能区分 bi-encoder（快、适合初检）与 cross-encoder（准、适合精排）的取舍。

出处：CSDN《RAG 核心技术面试指南：大模型工程师必备考点》。

内容来源

整理自 CSDN《RAG 核心技术面试指南：大模型工程师必备考点》

本站内容整理自公开面经与开源仓库，仅供学习交流，严禁杜撰。