题目
RAG 系统中检索质量直接决定最终效果,请列出提升检索召回与精度的关键手段。
参考答案
检索是 RAG 的”天花板”——检索不到,再强的 LLM 也无济于事。优化可从四层入手:
1. 文档处理层
- 切块(Chunking)策略:按语义/结构切分而非固定长度;保留标题层级;设置重叠(overlap)避免切断上下文。
- 元数据标注:为 chunk 附上来源、时间、章节等元数据,便于过滤与溯源。
- 父子块/小到大检索:用小块做匹配,返回其所属大块给 LLM,兼顾精度与上下文完整。
2. 检索方法层
- 混合检索(Hybrid):向量检索(语义)+ 关键词检索(BM25,精确匹配)。两者互补,召回更全。
- 多路召回 + 融合:用不同 embedding 模型或不同查询改写并行检索,再 RRF 融合排序。
- 查询改写/扩展:LLM 把用户问题改写为更利于检索的形式,或拆解子问题分别检索。
3. 重排序层(Rerank)
- 初检召回较多(如 Top-50),再用 cross-encoder 重排模型(如 bge-reranker)精排到 Top-5。
- Cross-encoder 比 bi-encoder 精度高但慢,用于小集合精排性价比高。
4. Embedding 与索引层
- 选强 embedding 模型(bge-m3、gte 等),中英文与长文本表现差异大。
- 多向量/稀疏向量索引(如 Milvus 混合索引)兼顾语义与字面。
- 定期评估召回率(Recall@K),用 badcase 驱动迭代。
面试加分点:强调”检索是天花板、生成是地板”,并能区分 bi-encoder(快、适合初检)与 cross-encoder(准、适合精排)的取舍。
出处:CSDN《RAG 核心技术面试指南:大模型工程师必备考点》。
内容来源
整理自 CSDN《RAG 核心技术面试指南:大模型工程师必备考点》
本站内容整理自公开面经与开源仓库,仅供学习交流,严禁杜撰。