• 我的订阅
  • 科技

AI 胡说八道怎么办?牛津大学开发了一种“测谎”方法

类别:科技 发布时间:2024-07-01 11:40:00 来源:科普中国

胡说八道不可怕,一本正经的胡说八道才可怕,你因为一本正经而信了ta的胡说八道,更可怕……这就是当下我们(捏着鼻子)使用 AI 时需要面对的现状。

如何避免 AI 生成虚假的事实内容,对使用者产生误导呢?各个大模型平台一直在研究和尝试,而要想“避免”问题,首先得“识别”问题。6 月 19 日,牛津大学一个研究团队发表在《自然》杂志上的一项新研究,提出了一种颇有潜力的给AI“测谎”的方法,下面咱们就详细聊聊。

大模型的胡说八道和风险

“幻觉”(Hallucinations)是大语言模型(例如 ChatGPT、Gemini、或文心一言)面临的一个关键问题,也是网络上常见的用户体验吐槽类型之一,这个术语可以粗略地理解为 AI 一本正经的胡说八道。

比如,你问 ChatGPT:恐龙扛狼是什么意思?

它会一本正经地告诉你——这象征着旧势力和新力量的对抗,是弱小但机智灵活的挑战者和强大却缺乏灵活的对手之间的博弈。

答案非常洗涤灵魂,上升到哲理和价值观高度,但是,它在胡说八道。

AI 胡说八道怎么办?牛津大学开发了一种“测谎”方法

点击输入图片描述(最多30字)

这只是大语言模型常见的“幻觉”类型之一,其他类型还包括:

1

错误的历史事实

“谁是美国的第一位总统?” ChatGPT 回答:“托马斯·杰斐逊。”

2

错误的科学信息

“水的沸点是多少?” ChatGPT 回答:“水在标准大气压下的沸点是 120 摄氏度。”

3

编造引用,AI 缝合怪

“爱因斯坦在相对论中说了什么?” ChatGPT 回答:“爱因斯坦曾在《相对论与现实》一书中说过,‘时间是一种幻觉’。”虽然爱因斯坦的确讨论过时间的相对性,但他并没有在所谓的《相对论与现实》一书中发表这句话。实际上,这本书可能根本不存在。这是模型编造的引用。

4

误导性的健康、法务、财务建议

你问:“感冒了应该吃什么药?” ChatGPT 回答:“感冒了应该吃抗生素。”

除了上述问题,相信大家在使用 AI 的过程中也会碰到其他胡说八道的情况。尽管各个大模型都在积极处理这类问题,上面举的例子很多可能也已经得到了修复,但这类问题一直难以找到“根治”或“清除”的办法,在检验判断上也往往需要人工反馈或数据集标注,这会带来不低的成本。

这让我们使用 AI 的体验大打折扣——谁敢毫无保留地信任一个满嘴跑火车的助手呢?何况有些问题事关健康和安全,弄错可是要出大事的。

有没有什么办法,能更通用化地“计算”出 AI 到底有没有瞎说呢?

“语义熵”如何帮助大模型检测谎言?

日前(6 月 19 日),牛津大学团队在《自然》(Nature)杂志发表了一篇论文,提出了一种新的分析和计算方法,为解决大语言模型“幻觉”问题,打开了新思路。

AI 胡说八道怎么办?牛津大学开发了一种“测谎”方法

点击输入图片描述(最多30字)

图源:《自然》(Nature)官网,中文翻译来自浏览器插件“沉浸式翻译”

团队提出了一种基于统计学的熵估计方法,称为“语义熵”,来检测大语言模型中的“编造”(confabulation),即大模型饱受诟病的“胡言乱语症”。作者在多个数据集上测试了语义熵方法,结果显示语义熵方法在检测编造方面显著优于其他基准方法。

那么“语义熵”究竟是什么呢?

抛开冗长的专业解释,我们可以将语义熵简单理解为概率统计的一种指标,用来测量一段答案中的信息是否一致。如果熵值较低,即大家都给出类似的答案,说明信息可信。但如果熵值较高,答案各不相同,说明信息可能有问题。

这有点类似于,如果一个人在撒谎,他可能没办法每次把谎言的细节编造得一模一样。一个谎言往往需要无数个谎言来帮它扯圆。从信息论的角度来看,可能会引入更多的不确定性和随机性。说谎者需要引入额外的信息或细节来支持其不真实的叙述,这可能会增加信息的不确定性或熵值,进而被算法检测出来。

比如,当你问 AI“世界上最高的山是哪座?”

大模型可能会给出几个答案:“珠穆朗玛峰”“乞力马扎罗山”“安第斯山脉”。

通过计算这些答案的语义熵,发现“珠穆朗玛峰”这个答案出现频率最高,其他答案则很少甚至没有出现。低语义熵值表明“珠穆朗玛峰”是可信的答案。

语义熵,既有优势,也有弱点

语义熵检测方法的优势在于不需要任何先验知识,无需额外的监督或强化学习。通俗地讲,使用这种方法时,并不需要上知天文下知地理,只需要遇事不决看看大家都怎么说。

而目前常用的诸如标注数据、对抗性训练等方法,“泛化”效果(即举一反三的能力),都不如通过语义熵计算。即便是大模型从未遇到过的新语义场景,也能适用语义熵方法。

当然,语义熵虽然是一种相对有效的办法,但不是万灵药,它自己也有一定局限性:

1

处理模糊和复杂问题的能力有限

语义熵在处理非常模糊或复杂的问题时可能不够有效。

在面对多种可能正确答案的问题时,比如“最好的编程语言是什么?”,语义熵可能无法明确区分哪一个答案更可靠,因为多个答案都可能是合理的。

(谁说是 Python?我 C++第一个不服!!)

2

忽略上下文和常识

语义熵主要基于统计和概率计算,可能忽略了上下文和常识的影响。在一些需要综合上下文和常识来判断的问题中,语义熵可能无法提供准确的可靠性评估。比如经常谈恋爱的朋友可能有体会,情侣间一句话:“我没事儿,你忙吧。”

你觉得 TA 是真没事儿,还是有很大事儿?

在这种情况下,得结合上下文场景、人物状态等信息判断,不同的上下文会导致不同的理解。语义熵只能基于词语的统计概率进行评估,可能会给出错误的判断。

再比如常识性的判断,既物理世界的客观规律,假设我们问一个问题:“太阳从哪边升起?”

正确答案是“东边”。然而,如果我们有以下两个候选答案:

1、太阳从东边升起。

2、太阳从西边升起。

(这可能由于模型训练数据的偏差和生成过程的随机性导致)

即使语义熵检测到两个答案的概率分布接近,但常识告诉我们答案 1 才是正确的。语义熵在这种情况下可能无法提供足够的信息来判断答案的可靠性。

3

如果训练数据被无意或刻意“污染”,语义熵也没办法很好识别

如果用错误的数据,给大模型施加了“思想钢印”,模型对其生成的错误陈述非常“自信”(即错误陈述在模型的输出概率分布中占主导地位),那么这些陈述的熵值可能并不会很高。

最后总结一下,从大模型的内容生成机制上看,“幻觉”问题没办法 100%避免。当我们在使用AI生成的内容时,重要的数理推理、历史事件或科学结论、法律和健康知识等方面最好进行人工核查。

不过,换个角度,“幻觉”也是大语言模型的创造力体现,我们也许应该善用大模型的“幻觉”能力。毕竟幻觉不一定是 bug(故障),而是大模型的 feature(特点)。

如果需要检索事实,我们已经有了搜索引擎工具。但如果需要有人帮我们编辑一个“恐龙扛狼”的无厘头剧本,那么,大语言模型显然是个更好的助手。

AI 胡说八道怎么办?牛津大学开发了一种“测谎”方法

点击输入图片描述(最多30字)

比如笔者费尽心思想画一幅恐龙扛狼图,但某 AI 油盐不进,画出了一幅恐龙把狼吞了(疑似)的图,难怪理解不了恐龙扛狼的真意啊……

参考文献

[1] S. Farquhar, J. Kossen, L. Kuhn, and Y. Gal, “Detecting hallucinations in large language models using semantic entropy,” Nature, vol. 630, no. 8017, pp. 625–630, 2024, doi: 10.1038/s41586-024-07421-0.

策划制作

作者丨木木 北京师范大学数学专业 资深产品经理 人工智能创业者

审核丨于旸 腾讯玄武实验室负责人

策划丨丁崝

责编丨丁崝

审校丨徐来、林林

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-07-01 16:45:01

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

...组织植入实验鼠大脑切片时会与宿主组织融为一体。英国牛津大学研究人员开发的这项突破性技术有朝一日可能为脑损伤者提供量身定制的修复。研究人员首次证明,神经细胞可以通过3D打印来模
2023-10-25 18:02:00
品牌故事|泌妍背后科技源自牛津大学研发专家团队
...组织工程器官修复的上市公司。历经十余年潜心研发并与牛津大学、香港大学、第四军医大学,解放军总医院等权威科研机构开展广泛合作,研发出中国唯一获准上市的组织工程人工皮肤。 继而成
2023-07-03 17:01:00
中国科学院上海有机所胡金波:氟化物开发十分重要,无害化生产需考虑利用效率
...化钙处于0米的平地,氟化氢处于100米高的台阶,而目前牛津大学的研究就像是从平地向上爬了10米,相比于0米确实有明显进步,但氟化能力还是较弱。4. 新方法产生了Fluorom
2023-08-17 20:01:00
《牛津高阶英汉双解词典》的中国之路
...版社合作,只引进一流的知名语言工具书。此时,英国的牛津大学出版社进入了商务的视野。1979年初夏,时任商务印书馆总经理、总编辑陈原同志邀请牛津大学出版社辞书部总编辑罗伯特·伯
2023-06-16 09:55:00
《牛津高阶》第10版,词汇学习新高度
...津高阶英汉双解词典》(第10版)翻译自最新英文版,由牛津大学出版社授权商务印书馆出版。第10版词典共收录单词、短语
2023-08-02 10:45:00
国际“AI 时代 智启未来”主题交流会在京举办 AI 估值技术引产学研投关注
...国市场轻资产、高成长科技企业的需求。而牛津智能依托牛津大学 10 年研发积累,构建以 “技术价值效用理论” 为核心的 AI 估值体系
2025-09-28 16:54:00
世界经理人发布2024年亚洲10大超级豪宅排行榜
...府(第八名)。主办方世界经理人集团学术委员会主席、牛津大学赛德商学院营销学荣誉教授斯蒂芬·沃格(Prof. Steve Woolgar)
2024-09-25 21:11:00
“这是我们与小朋友们的约定”
...定”受访者供图12月5日是第38个国际志愿者日,扬州大学牛津团的志愿者们为远在贵州省安顺市关岭布依族苗族自治县第三中学的小学生送去了冬日的第一份暖心大礼包。“暖心大礼包里有一
2023-12-06 09:41:00
上海赛艇公开赛周末起航,“牛津剑桥对抗赛”划到了苏州河
...化普及,以上艇赛事助力上海建设全球著名体育城市。“牛津剑桥对抗赛”来到上海 今年,上海赛艇公开赛走出了深化国际影响力的第一步,通过国际顶尖选手的参赛增强赛事全球关注度,也给
2023-09-15 10:08:00
更多关于科技的资讯:
“供应链”到“共赢链”,2025智链顺达生态合作伙伴大会召开
从“供应链”到“共赢链”,青岛智链顺达科技有限公司正通过开放、智能、协同的供应链体系,为传统制造业的转型升级提供一个价值共生
2025-10-17 17:54:00
都市丽人——加拿大鹅绒保暖衣背后的战略咨询公司
当都市丽人的加拿大鹅绒保暖衣在冬日市场中掀起热潮,新品订货会上取得经销商5亿订单销量的数据。这个经典内衣品牌的华丽转身背后
2025-10-17 13:41:00
秋补正当红|邂逅秋补热潮,抖音生活服务一站式解锁多元滋补新体验
转眼秋意渐浓,中秋、国庆双节余温未散,团圆出游的热潮与“应季而食、适时而补”的传统饮食文化相互交织,共同点燃了金秋时节的滋补消费热情
2025-10-17 13:56:00
江西热敏灸机器人获批上市 赋能百亿产业链提速
本报讯(全媒体记者李芳)10月9日,省药监局正式批准热敏灸机器人第二类医疗器械上市。这标志着江西热敏灸产业进入数智化时代
2025-10-17 07:10:00
厦门网讯 (厦门日报记者 薛尧)无人机、运动相机迎来降价潮!近日有市民发现相关热门产品价格跳水,记者走访了解到,我市多家大疆授权体验店中
2025-10-16 08:38:00
助力视弱群体畅行 公交视弱辅助系统“喊”您上车
视弱人士庄先生在公交视弱辅助系统的帮助下乘车。厦门网讯(文/图 厦门日报记者 林钦圣 通讯员 江安娜) “我们先找到并打开公交App
2025-10-16 08:38:00
10月15日晚,福州金融街商务区“亮灯”,迎接2025世界航海装备大会。
2025-10-16 08:59:00
近日,中石化石油工程设计有限公司自主研发的“管道环焊缝射线检测缺陷智能辅助评判系统”,顺利完成准确率测试。本次测试中,该系统总计检查了210张油气长输管道环焊缝射线检测底片
2025-10-16 09:03:00
当“遇到问题先到社交媒体上搜索”成为一代青少年的本能反应,当班级群、兴趣圈与直播平台深度嵌入他们的日常生活,社交网络正构成这代“数字原住民”成长的基本环境
2025-10-16 09:16:00
在人工智能技术飞速发展的今天,大模型以其强大的信息处理与泛化能力,正深刻改变医学领域的科研与临床实践。与此同时,以聚类分析
2025-10-16 09:57:00
人去世了朋友圈会消失吗?微信:对长时间不使用账号已不再回收
10月15日,“微信派”微信公众号发布最新一期播客,聊到了“真的很多人不发朋友圈了吗?”“人去世后,朋友圈会被回收吗?”等话题
2025-10-16 10:13:00
日日佳携手企知道,共同推动智能显示技术科技创新
近日,深圳日日佳显示技术有限公司(以下简称“日日佳”或“公司”)正式签约入驻企知道科创空间。作为专注于TFT-LCD模组制造的细分领域的国家高新技术企业和深圳市专精特新中小企业
2025-10-16 10:18:00
汽车测评 全球协同 | 解码C-NCAP——护航公众出行安全
当汽车从单纯的“交通工具”升级为承载多元需求的“出行载体”,是什么力量在守护这场变革的安全底线?2025世界NCAP大会即将在中国上海启幕
2025-10-16 10:50:00
花田玑密入选“2025山东省优秀兴农电商企业案例”
2025年10月16日,由山东省商务厅主办的“数商兴农庆丰收暨九九网购节”电商促消费活动在青岛莱西市人民广场隆重启动。花田玑密品牌创始人
2025-10-16 10:53:00
香港金管局公布生成式AI沙盒名单,蚂蚁数科入选技术合作伙伴
10月15日,香港金融管理局(HKMA)与香港数码港管理有限公司联合公布第二期生成式AI沙盒参与者名单。蚂蚁银行、中银香港
2025-10-16 11:24:00