AI & Machine Learning
RAG
检索增强生成——让 LLM 能读你的私有数据再回答问题,AI 知识库的核心模式。
它是什么
RAG(Retrieval-Augmented Generation)先从知识库中检索相关文档,再把文档片段注入 prompt 让 LLM 基于这些信息回答。相当于给 LLM 配了一个「资料库」。
为什么重要
LLM 有知识截止日期,也不知道你的私有数据。RAG 解决了这两个问题——让 AI 能回答最新信息和企业内部知识,是 AI 落地的核心模式。
核心概念
EmbeddingChunkingVector StoreSemantic SearchRerankingHybrid Search
我的使用体验
做过 RAG 项目,踩过不少坑:chunk size 选不对效果天差地别,中文分块比英文麻烦很多。现在偏好小 chunk + 父文档召回的模式。