大模型为什么会"一本正经胡说八道"?聊聊AI幻觉

王尘宇 AI百科 8

你问ChatGPT一个它不知道的事,它不会说"我不知道",而是编一个看起来很像那么回事的答案。这种现象叫AI幻觉(Hallucination),是目前大语言模型最让人头疼的问题之一。

说白了,大模型就是个"超级补全机器"。它在海量文本上训练,学会了"给定上半句,预测下半句"的模式。当你问它一个问题,它并不是真的去查资料、理解逻辑,而是根据训练数据里的模式,生成一个"最像正确答案"的文本。如果训练数据里没有相关信息,它也会硬生成一个——因为它被训练成"必须回答",而不是"承认不知道"。

幻觉的几种典型表现

最常见的是编造事实。你问它某本书的作者是谁,它可能给你一个错误的名字,但说得特别自信。你问它某个公司的创始人,它可能把A公司和B公司的创始人搞混。

第二种是编造引用。你让它列几篇参考文献,它能给你一堆看起来很正规的论文标题和作者名——但你去搜,根本不存在。这种在学术写作里特别危险。

第三种是逻辑自洽但前提错误。它的推理过程没问题,但出发点就是错的,所以结论也是错的。这种最难发现,因为读起来特别通顺。

为什么大模型会这样?

根源在训练方式。大模型的训练目标是"预测下一个token",不是"说真话"。它优化的是语言的流畅度和概率分布,不是事实的准确性。打个比方:一个学生背了很多作文范文,考试时能写出很漂亮的文章,但内容可能是瞎编的——因为他学的是"怎么写",不是"什么是真的"。

另外,大模型没有真正的"记忆"。它不像数据库那样存储精确信息,而是把知识压缩成了参数。这个压缩过程必然有损耗,细节部分特别容易出错。

怎么减少幻觉?

现在业界用得最多的方法是RAG(检索增强生成)。简单说就是让大模型先去查资料,再根据查到的内容回答。这样它的回答有了依据,幻觉率能降不少。DeepSeek和Kimi在这方面做得相对好,它们会主动标注信息来源。

另一个方法是让模型学会说"我不知道"。这需要在训练阶段就加入"拒绝回答"的样本,让模型知道不是每个问题都必须回答。但这个度很难把握——太保守了,模型动不动就说"我不确定",用户体验很差。

对普通用户来说,最实用的办法是交叉验证。同一个问题问两三个不同的AI,如果答案不一致,大概率有幻觉。涉及数字、日期、人名这些精确信息,一定要自己再去核实一遍。

幻觉能彻底解决吗?

短期内不太可能。只要大模型还是基于概率生成文本的架构,幻觉就是内置的。学术界在研究各种方法,比如用知识图谱约束生成、用强化学习奖励准确回答,但目前还没有哪个方案能彻底消除幻觉。

说到底,把大模型当"全能百科"用是不现实的。它更像一个知识渊博但偶尔记错细节的朋友——大部分时候靠谱,但关键信息你得自己确认。

标签: AI幻觉 大语言模型 Hallucination AI原理

发布评论 0条评论)

  • Refresh code

还木有评论哦,快来抢沙发吧~