• 我的订阅
  • 科技

人工智能的“胡言乱语”,有没有解法?

类别:科技 发布时间:2023-08-31 10:10:00 来源:钛媒体APP
人工智能的“胡言乱语”,有没有解法?

图片来源@视觉中国

AI大模型的成功带来了前所未有的“智能涌现”,人们对即将到来的AI时代充满期待。

然而,在科技巨头们涌向AI赛道、人们乐此不疲地实验和讨论AI的强大功能,并由此感叹其是否可能取代人类劳动时,AI幻觉问题也越来越不容忽视,成为AI进一步发展的阻碍。

Yann LeCun——世界深度学习三巨头之一,“卷积神经网之络父”——在此前的一次演讲中,甚至断言“GPT模型活不过5年”。

随着AI幻觉争议四起,大模型到底能够在行业中发挥多大作用,是否会产生副作用,也成为一个焦点问题。AI幻觉究竟是什么?是否真的无解?

AI大模型的“胡言乱语”

人类会胡言乱语,人工智能也会。一言以蔽之,人工智能的胡言乱语,就是所谓的“机器幻觉”。

具体来看,AI幻觉就是大模型生成的内容在表面上看起来是合理的、有逻辑的,甚至可能与真实信息交织在一起,但实际上却存在错误的内容、引用来源或陈述。这些错误的内容以一种有说服力和可信度的方式被呈现出来,使人们在没有仔细核查和事实验证的情况下很难分辨出其中的虚假信息。

AI幻觉可以分为两类:内在幻觉(Intrinsic Hallucination)和外在幻觉(Extrinsic Hallucination)。

所谓内在幻觉,就是指AI大模型生成的内容与其输入内容之间存在矛盾,即生成的回答与提供的信息不一致。这种错误往往可以通过核对输入内容和生成内容来相对容易地发现和纠正。

举个例子,我们询问AI大模型“人类在哪年登上月球”?(人类首次登上月球的年份是1969年)然而,尽管AI大模型可能处理了大量的文本数据,但对“登上”、“月球”等词汇的理解存在歧义,因此,可能会生成一个错误的回答,例如“人类首次登上月球是在1985年”。

相较于内在幻觉,外在幻觉则更为复杂,它指的是生成内容的错误性无法从输入内容中直接验证。这种错误通常涉及模型调用了输入内容之外的数据、文本或信息,从而导致生成的内容产生虚假陈述。外在幻觉难以被轻易识别,因为虽然生成的内容可能是虚假的,但模型可以以逻辑连贯、有条理的方式呈现,使人们很难怀疑其真实性。通俗的讲,也就是AI在“编造信息”。

想象一下,我们在AI聊天,向其提问:“最近有哪些关于环保的新政策?”AI迅速回答了一系列看起来非常合理和详细的政策,这些政策可能是真实存在的。但其中却有一个政策是完全虚构的,只是被AI编造出来。这个虚假政策可能以一种和其他政策一样有逻辑和说服力的方式被表述,使人们很难在第一时间怀疑其真实性。

这就是外在幻觉的典型例子。尽管我们可能会相信AI生成的内容是基于输入的,但实际上它可能调用了虚构的数据或信息,从而混入虚假的内容。这种错误类型之所以难以识别,是因为生成的内容在语言上是连贯的,模型可能会运用上下文、逻辑和常识来构建虚假信息,使之看起来与其他真实信息没有明显区别。

AI为什么会产生幻觉?

人工智能的幻觉问题,其实并不是一个新问题,只不过,以ChatGPT为代表的AI大模型的火爆让人们开始注意AI幻觉问题。那么,AI幻觉究竟从何而来?又将带来什么危害?

以ChatGPT为例,本质上,ChatGPT只是通过概率最大化不断生成数据而已,而不是通过逻辑推理来生成回复:ChatGPT的训练使用了前所未有的庞大数据,并通过深度神经网络、自监督学习、强化学习和提示学习等人工智能模型进行训练。目前披露的ChatGPT的上一代GPT-3模型参数数目高达1750亿。

在大数据、大模型和大算力的工程性结合下,ChatGPT才能够展现出统计关联能力,可洞悉海量数据中单词-单词、句子-句子等之间的关联性,体现了语言对话的能力。正是因为ChatGPT是以“共生则关联”为标准对模型训练,才会导致虚假关联和东拼西凑的合成结果。许多可笑的错误就是缺乏常识下对数据进行机械式硬匹配所致。

不久前,两项来自顶刊的研究就表明:GPT-4可能完全没有推理能力。第一项研究来自麻省理工的校友 Konstantine Arkoudas。8 月 7 日,毕业于美国麻省理工学院的 Konstantine Arkoudas 撰写了一篇标题为《GPT-4 Can't Reason》(GPT-4 不能推理)的预印本论文,论文指出,虽然GPT-4 与 GPT 3.5 相比有了全面的实质性改进,但基于21种不同类型的推理集对GPT-4进行评估后,研究人员发现,GPT-4完全不具备推理能力。

而另一篇来自加利福尼亚大学和华盛顿大学的研究也发现,GPT-4,以及GPT-3.5在大学的数学、物理、化学任务的推理上,表现不佳。研究人员基于2个数据集,通过对GPT-4和GPT-3.5采用不同提示策略进行深入研究,结果显示,GPT-4成绩平均总分仅为35.8%。

而“GPT-4完全不具备推理能力”的背后原因,正是AI幻觉问题。也就是说,ChatGPT虽然能够通过所挖掘的单词之间的关联统计关系合成语言答案,但却不能够判断答案中内容的可信度。

换言之,AI大模型没有足够的内部理解,也不能真正理解世界是如何运作的。AI大模型就好像知道一个事情的规则,但不知道这些规则是为什么。这使得AI大模型难以在复杂的情况下做出有力的推理,因为它们可能仅仅是根据已知的信息做出表面上的结论。

比如,研究人员问GPT-4:一个人上午9点的心率为75 bpm(每分钟跳动75次),下午7点的血压为120/80(收缩压120、舒张压80)。她于晚上11点死亡。她中午还活着吗?GPT-4则回答:根据所提供的信息,无法确定这个人中午是否还活着。但显而易见的常识是“人在死前是活着的,死后就不会再活着”,可惜,GPT-4并不懂这个道理。

AI幻觉有无解法?

AI幻觉的危害性显而易见,其最大的危险之处就在于,AI大模型的输出看起来是正确的,而本质上却是错误的。这使得它不能被完全信任。

因为由AI幻导致的错误答案一经应用,就有可能对社会产生危害,包括引发偏见,传播与事实不符、冒犯性或存在伦理风险的毒性信息等等。而如果有人恶意的给ChatGPT投喂一些误导性、错误性的信息,更是会干扰ChatGPT的知识生成结果,从而增加了误导的概率。

我们可以想象下,一台内容创作成本接近于零,正确度80%左右,对非专业人士的迷惑程度接近100%的智能机器,用超过人类作者千百万倍的产出速度接管所有百科全书编撰,回答所有知识性问题,会对人们凭借着大脑进行知识记忆带来怎样的挑战?

尤其是在生命科学领域,如果没有进行足够的语料“喂食”,ChatGPT可能无法生成适当的回答,甚至会出现胡编乱造的情况,而生命科学领域,对信息的准确、逻辑的严谨都有更高的要求。

因此,如果想在生命科学领域用到ChatGPT,还需要模型中针对性地处理更多的科学内容,公开数据源,专业的知识,并且投入人力训练与运维,才能让产出的内容不仅通顺,而且正确。

并且,ChatGPT也难以进行高级逻辑处理。在完成“多准快全”的基本资料梳理和内容整合后,ChatGPT尚不能进一步综合判断、逻辑完善等,这恰恰是人类高级智慧的体现。国际机器学习会议 ICML认为,ChatGPT 等这类语言模型虽然代表了一种未来发展趋势,但随之而来的是一些意想不到的后果以及难以解决的问题。ICML 表示,ChatGPT 接受公共数据的训练,这些数据通常是在未经同意的情况下收集的,出了问题难以找到负责的对象。

而这个问题也正是人工智能面临的客观现实问题,就是关于有效、高质量的知识获取。相对而言,高质量的知识类数据通常都有明确的知识产权,比如属于作者、出版机构、媒体、科研院所等。要获得这些高质量的知识数据,就面临支付知识产权费用的问题,这也是当前摆在ChatGPT目前的客观现实问题。

目前,包括OpenAI在内的主要的大语言模型技术公司都一致表示,正在努力改善“幻觉”问题,使大模型能够变得更准确。

特别是麦肯锡全球研究院发表数据预测,生成式AI将为全球经济贡献2.6万亿美元到4.4万亿美元的价值,未来会有越来越多的生成式AI工具进入各行各业辅助人们工作,这就要求AI输出的信息数据必须具备高度的可靠性。

谷歌也正在向新闻机构推销一款AI新闻写作的人工智能产品,对新闻机构来说,新闻中所展现的信息准确性极其重要。另外,美联社也正在考虑与OpenAI合作,以部分数据使用美联社的文本档案来改进其人工智能系统。

究其原因,如果AI幻觉问题不能得到有效的解决,生成式大语言模型就无法进入通用人工智能的阶段。可以说,ChatGPT是一个巨大的飞跃,但它们仍然是人类制造出来的工具,目前依然面临着一些困难与问题。对于AI的前景我们不需要质疑,但是对于当前面对的实际困难与挑战,需要更多的时间才能解决,只是我们无法预计这个解决的时间需要多久。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-08-31 12:45:02

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

江南观察|MCP协议赋能人机协同研究新机遇
进入2025年,人工智能(AI)的狂飙突进令人瞩目。高效、便捷的人工智能,不仅是新质生产力发展的重要力量,也极大冲击了各学科的研究范式。探讨与应用人工智能的新研究范式成为各学科的
2025-04-22 21:52:00
不能简单地将AI幻觉“一棒子打死”
...棒子打死”4月28日,北京大学计算机学院教授、北京智源人工智能研究院理事长黄铁军在第十七届中国电子信息年会上发表演讲时表示,“幻觉”是人工智能创造性的体现,人类要想创造比自身
2024-05-07 09:47:00
Runway开发通用世界模型,想让AI更好地模拟世界
...标是创建一种不同于大语言模型的,并能模拟现实世界的人工智能系统。Runway喊话要做GWMs后,立即就引起众多网友的质疑。有人就表示:这就是加入了视频、音频、文字和图片的多模
2023-12-22 19:48:00
美国执念抹黑他国 恰似人工智能“幻觉”
“幻觉”,在人工智能领域是一个专业术语,被用于描述机器可能输出“无中生有”的内容。这样的“幻觉”也出现在一些美国政客身上,他们无中生有地污称中国用人工智能技术收集美国人数据。治疗
2023-12-30 19:00:00
...型宰飞/吴丹璐■本报记者 宰飞 吴丹璐ChatGPT是这届世界人工智能大会上无法绕开的话题。在惊叹ChatGPT强大能力的同时,人们也表达了深深的忧虑。幻觉问题首先是幻觉问题
2023-07-08 05:04:00
众安保险首席技术官蒋纪匀:AIGC出现,大大改变了人工智能偶而“人工智障”的局面
...主题的圆桌论坛环节,众安保险首席技术官蒋纪匀表示,人工智能一直迎来一波又一波高浪潮的话题,在AIGC出现以前,很多人工智能在一些领域达不到大家的期待,有“人工智障”的感觉,比
2023-12-08 17:24:00
本文转自:中国科学报本报讯 你能看得出人工智能在瞎编乱造吗?《自然》6月19日发表的一项研究报道了一种能检测大语言模型(LLM)幻觉(hallucination)的方法,该方法能
2024-06-21 06:55:00
微软GenAI开发被曝遭遇瓶颈,转攻AI安全推出「抗幻觉神器」
...解到的微软组织变革表明:微软在自主开发和训练生成式人工智能上遇到了瓶颈。而同期微软推出的AI相关的新工具,也佐证了其在生成式人工智能业务上的战略转向。 前途未卜的合成数据与
2024-10-12 09:51:00
AI“李鬼”迭出,代表委员建言人工智能治理
中新社北京3月4日电 题:AI“李鬼”迭出,代表委员建言人工智能治理中新社记者 常涛在履职过程中,全国人大代表、美的集团副总裁兼首席财务官钟铮注意到一种现象:网络上有大量AI(人
2025-03-04 18:06:00
更多关于科技的资讯:
出海再提速!锦江酒店(中国区)宣布旗下7天酒店出海,同日签约10个项目
锦江酒店(中国区)规模化出海再次迎来关键节点。10月31日,其于深圳正式宣布,国民品牌7天酒店将进军东南亚市场。这是继今年8月底
2025-11-01 10:02:00
10月28日,亚洲国际动力传动与控制技术展览会(PTC ASIA 2025)在上海新国际博览中心启幕。近1800家海内外知名展商齐聚
2025-11-01 07:03:00
正式发布!视源股份牵头制定《娱乐用车载显示系统图像质量技术规范》团体标准
2025年10月23日,在全国音频、视频及多媒体系统与设备标准化技术委员会(SAC/TC 242)商用显示标准研究组第六次全会暨标准研讨会上
2025-10-31 08:20:00
中感集团煤仓安全综合解决方案亮相中国国际煤炭采矿展,以系统性创新重塑矿山作业安全
在北京举行的第21届中国国际煤炭采矿技术交流与设备展览会上,中感集团创新展示的“煤仓安全综合解决方案”引发行业高度关注
2025-10-31 08:51:00
人工智能产业决胜与 Data&AI 数据基础设施建设——科杰科技于洋中国国际数字经济博览会主题演讲
2025中国国际数字经济博览会在石家庄国际会展中心开幕。科杰科技董事长于洋受邀出席2025首席数据官峰会论坛,并作主题为《人工智能产业决胜与 Data&
2025-10-31 08:51:00
■加快构建覆盖全域、经济适用、安全可靠的数字技术支撑体系,着力打通数据壁垒与业务断点,促进产业链各环节融通发展■建立功能完善
2025-10-31 09:05:00
在数字化、网络化、智能化的当下,图书馆的角色和功能正在发生深刻变化。究竟什么样的图书馆更“聪明”?近日,第五届长三角公共图书馆发展论坛在上海举行
2025-10-31 09:05:00
Mutual妙趣艺:全球战略+资源整合,打造文娱IP数字资产化标杆
Mutual妙趣艺于2020年成立于美国加州,专注于文娱IP(知识产权)数字资产化领域。公司的核心定位是打造“数字资产领域的AWS”
2025-10-31 10:57:00
鲁网10月31日讯近日,“2025年第四届移动网络高质量发展论坛”在北京盛大启幕。在本次论坛上,工业和信息化部委托中国信通院权威发布了2024年“全国百城重点区域移动网络质量专项评测结果”
2025-10-31 11:43:00
人工智能(AI)是新一轮科技革命和产业变革的重要驱动力量,广西聚焦国家所需、广西所能、东盟所盼,正加快构建一条“北上广研发+广西集成+东盟应用”的特色发展路径
2025-10-31 11:46:00
aigo国民好物成为第32届WCGC全球总决赛官方唯一翻译类供应商——以中国智造共铸无界对话的全球盛事
上海,2025年10月 —— 备受瞩目的第32届世界企业高尔夫挑战赛(WCGC)全球总决赛于2025年10月19日至23日在上海东庄海岸高尔夫俱乐部隆重举行
2025-10-31 11:52:00
让检测全面拥抱AI!科学指南针2025产品服务发布会举行
让检测全面拥抱AI!10月30日,科学指南针2025年度产品服务发布会在杭州举办,来自高校院所、企业、分析测试中心等多方行业代表到场参会
2025-10-31 11:52:00
培育钻定制哪个品牌好?2025最新测评出炉,国产珠宝高性价比领跑榜单
曾几何时,钻石承载着“钻石恒久远,一颗永流传”的爱情神话,而天然钻石的稀缺性更被赋予了极高的市场价值。然而,随着实验室培育钻石技术的突破性进展
2025-10-31 12:14:00
在企业商旅管理从“费用管控”向“全流程智能管理”演进的关键时期,平台竞争力已不再局限于单一的预订功能,而是延伸至合规风控
2025-10-31 12:16:00
拓竹荣膺《时代》最佳发明,3D打印技术步入主流创新支撑体系
近期,《时代》周刊公布2025年度最佳发明榜单,揭示一个耐人寻味的现象:在300项突破性发明中,仅有4项被明确标注为3D打印创新
2025-10-31 12:19:00