RAG是什么?用大白话讲清楚

王尘宇 AI百科 1

2026年AI圈提到最多的词除了Agent就是RAG了。很多技术文章把它写得很玄乎,其实概念很简单。

RAG就是"翻书再回答"

假设你问大模型一个问题:"我们公司今年的销售额是多少?"大模型是不知道的——它的训练数据里没有你公司的信息。RAG做的事就是:你问问题 → 系统先去你的知识库/文档里搜相关内容 → 把搜到的内容连同你的问题一起发给大模型 → 大模型基于这些"参考资料"来回答。相当于让AI先翻了相关资料再开口,而不是凭空编。

为什么需要RAG

两个原因。一是大模型的知识有截止日期,训练之后发生的事情它不知道。二是大模型会"幻觉"——不确定的事也装得很确定地说出来。RAG给了它参考资料,幻觉率明显下降。

一个实际例子

我们公司内部做了一个RAG系统:把所有产品文档、客户FAQ、技术手册喂进去。客服接到用户问题时,RAG系统先检索相关文档段落,再让AI基于这些段落回答。准确率从纯靠AI回答的70%提到了90%以上。

跟微调有什么区别

微调是"教AI学会新知识"——要训练、要GPU、费时间。RAG是"给AI一本参考书"——不需要训练,更新知识库就行。两者的区别就像让一个人重新上学(微调)和给他一本手册让他查(RAG)。

做RAG需要什么

一个向量数据库(存文档)、一个embedding模型(把文本转成向量)、一个大模型(生成答案)。开源方案里LangChain加ChromaDB加本地模型就能跑起来。

标签: RAG 检索增强生成 AI技术 大模型 向量数据库

发布评论 0条评论)

  • Refresh code

还木有评论哦,快来抢沙发吧~