• 我的订阅
  • 科技

AI幻觉:它真的会一本正经胡说八道!

类别:科技 发布时间:2025-02-19 18:57:00 来源:浅语科技

你是不是也遇到过这样的情况:问AI一个问题,它给了你一个特别详细、丰富,看上去好有逻辑的答案。

但当我们去核实时,却发现这些信息完全是虚构的?

这就是著名的“AI幻觉”现象。

AI幻觉:它真的会一本正经胡说八道!

上下滑动查看更多,图源:河森堡新浪微博

为什么会出现AI幻觉呢?今天就让我们一起来揭开这个谜题。

为什么会出现AI幻觉?

AI幻觉指的是AI会生成看似合理但实际确实错误的信息,最常见的表现就是会编造一些不存在的事实或者细节。

就像在考试时遇到不会的题目,我们会试图用已知的知识去推测答案一样。

AI在遇到信息缺失或不确定的情况时,会基于自己的“经验”(训练数据)进行填补和推理。

这不是因为它想要欺骗我们,而是因为它在试图用自己理解的模式来完成这个任务。

1、基于统计关系的预测

因为AI(尤其是像ChatGPT这样的语言模型)通过大量的训练数据学习文字之间的统计关系。它的核心目标是根据上下文预测最可能出现的下一个词,并不是对问题或内容进行真正的理解。

所以,AI本质上是通过概率最大化来生成内容,而不是通过逻辑推理来生成内容的。

简单来说,AI就像是一个博览群书的智者,通过学习海量的文本和资料来获取知识。但是它并不是真正理解这些知识,而是通过找到文字之间的统计关系和模式来“预测”下一个最合适的词。

换言之,AI是根据之前学到的大量例子,来猜测接下来最有可能出现的词。

不过有时候,模型也会“猜错”。如果前面出现一点偏差,后面的内容就会像滚雪球一样越滚越大。

这就是为什么AI有时会从一个小错误开始,最后编织出一个完全虚构的故事。

2、训练数据的局限性

由于AI并没有真实世界的体验,它的所有“认知”都来自训练数据。

可是训练数据不可能包含世界上所有的信息,有时候甚至还会包含错误信息。这就像是一个人只能根据自己读过的书来回答问题。

如果书里有错误信息,或者某些领域的知识缺失,就容易产生错误的判断。

举个例子:早期AI幻觉较大的时候,可能会出现AI学过“北京是中国的首都”和“巴黎有埃菲尔铁塔”这两个知识点。

当我们问它“北京有什么著名建筑”时,它可能会把这些知识错误地混合在一起,说“北京有埃菲尔铁塔”。

3、过拟合问题

因为大模型的训练参数量非常庞大,大模型会在训练数据上产生“过拟合”的问题。

也就是因为记住了太多错误或者无关紧要的东西,从而让 AI对训练数据中的噪声过于敏感,最终导致幻觉产生。

4、有限的上下文窗口

受限于技术原因,虽然现在大模型的上下文窗口越来越大(比如可以处理64k或128k个tokens),但它们仍然是在一个有限的范围内理解文本。

这就像是隔着一个小窗口看书,看不到整本书的内容,容易产生理解偏差。

5、生成流畅回答的设计

现在很多大模型被设计成要给出流畅的回答,当它对某个问题不太确定时,与其说“我不知道”,它更倾向于基于已有知识编造看起来合理的答案。

上面的种种情况叠加在一起,造成了现在非常严重的AI幻觉问题。

如何才能降低AI幻觉?

AI看起来很方便,但 AI 一本正经的“胡说八道”有时候真的让人非常头疼,给的信息经常需要反复核实,有时反而不如直接上网搜索来得实在。

那么,如何应对AI幻觉呢?我们总结了下面这些方法帮助大家。

1、优化提问

想要获得准确答案,提问方式很关键。与AI交流也需要明确和具体,避免模糊或开放性的问题,提问越具体、清晰,AI的回答越准确。

同时,我们在提问的时候要提供足够多的上下文或背景信息,这样也可以减少AI胡乱推测的可能性。总结成提示词技巧就是下面四种问法:

1.设定边界:“请严格限定在2022年《自然》期刊发表的研究范围内”;

示例:“介绍ChatGPT的发展历程”→“请仅基于OpenAI官方2022-2023年的公开文档,介绍ChatGPT的发展历程”

2.标注不确定:“对于模糊信息,需要标注‘此处为推测内容’”;

示例:“分析特斯拉2025年的市场份额”→“分析特斯拉2025年的市场份额,对于非官方数据或预测性内容,请标注[推测内容]”

3.步骤拆解:“第一步列举确定的事实依据,第二步展开详细分析”;

示例:“评估人工智能对就业的影响”→“请分两步评估AI对就业的影响:

1)先列出目前已发生的具体影响案例;

2)基于这些案例进行未来趋势分析”。

4.明确约束:明确告诉AI要基于已有事实回答,不要进行推测。

示例:“预测2024年房地产市场走势”→“请仅基于2023年的实际房地产数据和已出台的相关政策进行分析,不要加入任何推测性内容”。

2、分批输出

因为AI内容是根据概率来进行生成的,一次性生成的内容越多,出现AI幻觉的概率就越大,我们可以主动限制它的输出数量。

比如:如果我要写一篇长文章,就会这么跟AI说:“咱们一段一段来写,先把开头写好。等这部分满意了,再继续写下一段。”

这样不仅内容更准确,也更容易把控生成内容的质量。

3、交叉验证

想要提高AI回答的可靠性,还有一个实用的方法是采用“多模型交叉验证”。

使用的一个AI聚合平台:可以让多个AI模型同时回答同一个问题。

当遇到需要严谨答案的问题时,就会启动这个功能,让不同的大模型一起参与讨论,通过对比它们的答案来获得更全面的认识。

AI幻觉:它真的会一本正经胡说八道!

点击可放大,图片来源:作者提供

再比如纳米AI搜索平台的“多模型协作”功能,它能让不同的AI模型各司其职,形成一个高效的协作团队。

让擅长推理的DeepSeek-R1负责分析规划,再由通义千问进行纠错补充,最后交给豆包AI来梳理总结。

这种“专家组”式的协作模式,不仅能提升内容的可信度,还能带来更加全面和深入的见解。

AI幻觉:它真的会一本正经胡说八道!

上下滑动查看更多,图源:作者提供

4、RAG技术

AI是一个聪明但健忘的人,为了让他表现更靠谱,我们可以给他配一个超级百科全书,他可以随时查阅里面的内容来回答问题。

这本“百科全书”就是RAG的核心,它让AI在回答问题之前,先从可靠的资料中找到相关信息,再根据这些信息生成答案。

这样一来,AI就不容易“胡说八道”了。

目前RAG技术多用在医疗、法律、金融等专业领域,通过构建知识库来提升回答的准确性。

当然实际使用中像医疗、法律、金融这样的高风险领域,AI生成的内容还是必须要经过专业人士的审查的。

5、巧用AI幻觉

最后再说一个AI幻觉的好处。很多时候AI幻觉也是天马行空的创意火花!

就像一个异想天开的艺术家,不受常规思维的束缚,能蹦出令人惊喜的点子。

看看DeepSeek就知道了,它确实比ChatGPT和Claude更容易出现幻觉,但是今年DeepSeek能火得如此出圈也离不开其强大的创造能力。

有时候与其把AI幻觉当成缺陷,不如把它看作创意的源泉!在写作、艺术创作或头脑风暴时,这些“跳跃性思维”反而可能帮我们打开新世界的大门。

AI幻觉的本质——AI在知识的迷雾中,有时会创造出看似真实,实则虚幻的“影子”。

但就像任何工具一样,关键在于如何使用。当我们学会用正确的方式与AI对话,善用它的创造力,同时保持独立思考,AI就能成为我们得力的助手,而不是一个“能言善辩的谎言家”。

毕竟,在这个AI与人类共同进步的时代,重要的不是责备AI的不完美,而是学会与之更好地协作。

责任编辑:上方文Q

文章内容举报

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2025-02-19 20:45:08

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

“一本正经胡说八道”:AI幻觉到底有多可怕?
...幻觉乱象,层出不穷AI大模型固然“聪明”,但在“胡说八道”方面也毫不逊色。虚构引用、杜撰人物、逻辑混乱,在与AI的互动中屡见不鲜。例如,它会引用一篇根本不存在的“2023年哈
2025-04-01 19:54:00
AI 胡说八道怎么办?牛津大学开发了一种“测谎”方法
胡说八道不可怕,一本正经的胡说八道才可怕,你因为一本正经而信了ta的胡说八道,更可怕……这就是当下我们(捏着鼻子)使用 AI 时需要面对的现状。如何避免 AI 生成虚假的事实内容
2024-07-01 11:40:00
“80后死亡率高”疑似是AI造谣,AI已经开始胡说八道了
...2%。”AI无中生有的能力让人心颤。在AI业界,这类“胡说八道”的本领被称为“幻觉(hallucination)”
2025-03-11 05:56:00
对话北大赵东岩:为啥DeepSeek幻觉率这么高?用户如何避免被AI“欺骗”?
...k辅助就医、撰写论文时发现,DeepSeek会“一本正经地胡说八道”,把一些专有名词“张冠李戴”,用户难以发现DeepSeek的“幻觉陷阱”
2025-03-05 15:54:00
细思极恐!DeepSeek的胡编乱造正淹没互联网:真实性是当下AI最大的槽点
...。比如知乎的这条高赞回答,就是DeepSeek“一本正经胡说八道”的最典型的例证,而且由于输出的提示词到位,文风也接近人类,一般人还真不容易看出来。比如,文章说哪吒电影里的敖
2025-03-06 18:13:00
...至生成正式文本。有人发现,AI有时会“一本正经地胡说八道”,拼凑、嫁接甚至编造事实,这种现象被称为“AI幻觉”。而随着技术的发展,“AI幻觉”的复杂性和隐蔽性也在不断提升。无
2025-02-22 14:06:00
清华大学教授李宗鹏:大模型消除不了幻觉,大语言模型注定没有希望
...百度李彦宏称大模型基本消除了幻觉,AI从一本正经胡说八道变得可被信赖。清华大学李宗鹏在接受凤凰网财经采访时则指出,大模型永远不会彻底摆脱幻觉和出错的问题,这是数学上已经证明的
2024-11-20 22:02:00
人工智能为了游戏获胜会“说谎”
...家:需要对人工智能基础理论作修订AI“一本正经地胡说八道”这种现象被称为AI幻觉。AI幻觉指的是AI会生成貌似合理连贯,但同输入问题意图不一致、同世界知识不一致、与现实或已知
2024-05-14 04:02:00
大幅减缓幻觉 百融云创大模型精度测评结果出炉
...之一。大模型出现幻觉,轻则“画虎类犬”,重则“胡说八道”。即便是强大如Sora,它生成的视频中也有“翻车”的场面。比如那个经典的女郎漫步视频,如果仔细观察会发现,女郎走路的过
2024-03-28 16:16:00
更多关于科技的资讯:
苏州市女企协秘书长、国浩律师(苏州)事务所合伙人葛霞青律师荣登《钱伯斯大中华区指南2026》推荐榜单
江南时报讯 1月15日,全球领先的法律研究和分析机构钱伯斯(Chambers & Partners)发布《钱伯斯大中华区指南2026》(Chambers Greater China Region Guide 2026)
2026-01-21 15:23:00
盐城盐都:“翼”技傍身 照亮前程
江南时报讯 启动无人机,校准飞行参数,规划测绘航线,精准捕捉地面数据……日前,2026年盐城市盐都区首期无人机测绘操控员技能培训在都U+乐业空间正式开班
2026-01-21 15:24:00
全国首款!仙库3D智能足脊扫描仪正式发布!
近日,深圳仙库智能有限公司(以下简称“仙库”)正式发布仙库3D智能足脊扫描仪XK-CH005,这是全国首款实现“足脊一体”同步评估的硬核科技产品
2026-01-21 16:24:00
国家级备案落地!疯狂体育Foretell革命性AI平台,开启体育智能决策新阶段
2026年1月20日,疯狂体育正式官宣推出旗下AI赛事预测工具Foretell。凭借已经完成的国家互联网信息办公室深度合成服务算法备案资质
2026-01-21 16:47:00
当我们在思考“哪些中国企业创新做得不错”时,CES 2026舞台上的联想集团给出了一个全面而深刻的答案。这不仅仅是一次产品发布会
2026-01-21 16:49:00
近日,剑桥大学教育学院院长Hilary正式受聘为中国素质教育品牌欣乾程的学术顾问。此次合作不仅是国际顶尖学术力量与中国创新型教育机构的一次重要握手
2026-01-21 14:24:00
跨越顶奢与潮饮的“美酒+美食”表达 五粮液全力构建中国白酒全球新叙事
鲁网1月21日讯当一位新加坡米其林星厨在构思新菜单时,正在将中国白酒作为风味拼图中一块充满惊喜的“香料”。在他手中,一杯五粮液可能被用来平衡炙烤龙虾的鲜甜
2026-01-21 12:03:00
农行肥城桃都支行:以政策优势精准破解粮企贷款难题
鲁网1月21日讯2026年伊始,桃都支行延续2025年末服务“黄羽鸡”产业的奋进势头,步履不停,持续扎根三农,精准运用粮食购销领域的专项贷款方案
2026-01-21 12:05:00
海尔沙特召开2026年战略发布会
1月12日,海尔在沙特阿拉伯成功举办经销商峰会暨2026年战略发布会。会上不仅回顾了2025年业绩成果,更明确了2026年核心发展方向
2026-01-21 12:39:00
海尔智家旗下GE冰箱获2026“CES最佳产品”奖
当地时间1月6日至9日,全球科技盛宴2026年国际消费电子展(CES)在美国拉斯维加斯举行。海尔智家旗下GE Appliances推出的GE Profile智能四门法式对开门冰箱
2026-01-21 12:40:00
卡萨帝咖啡机亮相中奥建交55周年非遗特展复刻金杯标准
1月19日,中奥建交55周年非遗华服暨生命美学主题特展在北京启幕。中奥两国文化、艺术界代表齐聚一堂,众多非遗作品与艺术画作联袂展出
2026-01-21 12:40:00
【宅男财经|专家面对面】1月20日晚,李亚鹏在社交媒体发布视频,配文“再次感恩感谢大家对嫣然的关注,我们还有很长的路要走
2026-01-21 11:04:00
从“单项冠军”到“全能选手” 承德钒钛的市场驱动转型记
1月15日,承德钒钛产品技术室负责人冯国晟向记者展示高纯无氧化二钒样品。河北日报记者 李东宇摄1月15日上午,承德钒钛新材料有限公司钒钛事业部实验室里
2026-01-21 08:28:00
豆包与浦东美术馆达成合作,成为卢浮宫、毕加索双展官方AI讲解员
河北新闻网讯(记者 李春炜)1月20日,字节跳动旗下豆包与上海浦东美术馆达成合作,成为该馆两项国际大展——“图案的奇迹
2026-01-21 09:59:00
索乙“一人公司”的蓬勃发展,高度依赖于由前沿技术、赋能政策、开放产业和宽容文化共同构成的“创新气候”。它既代表了数字经济时代个体力量的崛起
2026-01-21 10:22:00