• 我的订阅
  • 科技

打脸“AI灭绝伦”!研究反驳:大模型涌现能力不会威胁人类生存

类别:科技 发布时间:2024-08-19 09:31:00 来源:学术头条

大语言模型(LLM)因“涌现能力”(emergent abilities)而拥有了超出人类预期的技能,但也因此让人类十分忌惮:操纵、欺骗人类,自主实施网络攻击,自动化生物研究......

然而,也有专家认为,这种过度的担忧会损害开源和创新,不利于人工智能(AI)行业的健康发展。当前,有关“AI 灭绝伦”的争论愈演愈烈。

那么,“涌现能力”真的是导致 AI 大模型威胁人类生存的罪魁祸首吗?一项最新研究否定了这一观点。

来自达姆施塔特工业大学和巴斯大学的研究团队发现,GPT 等 LLM 尚无法独立地学习或获得新技能,这意味着它们不会对人类构成生存威胁。

他们表示,“涌现能力” 背后的真相或许比科幻电影更富有戏剧性,许多所谓的“涌现能力”,其实都是 AI 大模型在面对不熟悉的任务时,依赖于已有的数据和经验做出的“即兴表演”。

相关研究论文以 “Are Emergent Abilities in Large Language Models just In-Context Learning?” 为题,已发表在 AI 顶会国际计算语言学年会(ACL)上。

打脸“AI灭绝伦”!研究反驳:大模型涌现能力不会威胁人类生存

他们通过一系列实验验证了 AI 大模型在不同上下文条件下的表现,结果发现:在零样本(zero-shot)的情况下,许多大模型根本无法展现所谓的“涌现能力”,反而表现得相当一般。

他们表示,这一发现有助于理解 LLM 的实际能力和局限性,并为未来的模型优化提供新的方向。

智能涌现:只是“即兴表演”?

AI 大模型的“涌现能力”来自哪里?它是否真如听起来那样神秘,甚至令人担忧?

为了破解这一谜题,研究团队选择了 GPT、T5、Falcon 和 LLaMA 系列模型作为研究对象,通过实验分析了非指令微调模型(如 GPT)和指令微调模型(如 Flan-T5-large)在 22 个任务(17 个已知的涌现任务和 7 个基线任务)和不同条件下的表现。

打脸“AI灭绝伦”!研究反驳:大模型涌现能力不会威胁人类生存

图|模型列表。

为了全面评估模型能力,他们将 Exact Match Accuracy、BERTScore Accuracy 和 String Edit Distance 作为评估指标。同时,为了提高实验的准确性,他们还进行了偏见控制,通过调整提示和输出格式,确保非指令微调模型的公平性,并通过手动评估验证模型输出的准确性。

在实验中,研究人员采用 zero-shot 和少样本(few-shot)两种设置,重点分析了 GPT 的表现能力。

打脸“AI灭绝伦”!研究反驳:大模型涌现能力不会威胁人类生存

图|非指令微调 GPT 模型在零样本下的表现。

令人惊讶的是,尽管 GPT 在之前的研究中被认为具有涌现能力,但在 zero-shot 的情况下,这种能力表现得非常有限。

具体而言,只有两个任务在不依赖上下文学习(ICL)的情况下展示了涌现能力,这两个任务主要依赖形式语言能力或信息检索,而非复杂的推理能力。由此可以得出,在没有上下文学习的条件下,GPT 模型的涌现能力受到了极大的限制。

然而,涌现能力的来源仅仅如此吗?研究团队又将目光转向了指令微调模型,提出了一个大胆的假设:指令微调并非简单的任务适应,而是通过隐式上下文学习,激发了模型的潜在能力。

通过对比 GPT-J(非指令微调)与 Flan-T5-large(指令微调)的任务解决能力,他们发现,尽管两者在参数规模、模型架构和预训练数据上存在显著差异,但在某些任务上的表现却出奇地一致。

打脸“AI灭绝伦”!研究反驳:大模型涌现能力不会威胁人类生存

图|两个模型的表现在高于随机基线部分有很大的重叠,这表明指令微调可以有效地获取上下文中的能力,而非导致功能性语言能力的涌现。

这一现象表明,指令微调模型可能并不是在展示一种全新的推理能力,而是通过隐式上下文学习,巧妙地利用了已有的上下文学习能力。

进一步的实验表明,无论是模型规模的增加,还是训练数据的丰富,指令微调模型在 zero-shot 的情况下,仍然能够与非指令微调模型表现出相似的任务解决能力。这一发现再次强调了指令微调与隐性上下文学习之间的紧密联系。

AI 威胁 人类生存:真实还是夸大?

尽管 LLM 在任务表现上展现出超凡的能力,但研究结果表明,这些能力并不意味着 AI 对人类生存构成实质性的威胁。

首先,LLM 的涌现能力主要来源于上下文学习和指令微调,这些技术在模型的设计和训练中是可以被预测和控制的,并未表现出完全自主发展的趋势,也没有产生独立的意图或动机。

例如,在社交智力测试(Social IQA)中,模型能够正确回答涉及情感和社会情境的问题,例如:“卡森醒来去上学时很兴奋。他为什么要这样做?”

在这一问题中,模型通过上下文学习和指令微调,能够超越随机基线(random baseline),选择出合理的答案。这说明模型并非在自发产生某种“智能”,而是在具体输入和设计条件下展现出的一种高级模式识别能力。

其次,研究发现随着 LLM 规模的扩大,这些能力表现得更加显著,但并未脱离设计者的控制。通过对模型的微调,可以引导 LLM 更好地理解和执行复杂任务,而这种能力的增强并不意味着模型会产生自主意识,还不足以对人类产生威胁。

在实验中,LLM在特定任务上的表现大大优于随机基线,尤其是在需要推理和判断的任务中。然而,这种表现依然依赖于大量训练数据和精心设计的输入提示,而非模型自发的智能觉醒。

这一结果进一步证实 LLM 的涌现能力是在可控范围内发展的,虽然这一假设仍需进一步的实验证实,但为研究理解大模型的涌现能力提供了一个全新的视角。

研究指出,虽然未来人工智能可能会在功能性语言能力上进一步发展,但其潜在危险性依然是可控的。现有证据还不能支持“AI灭绝伦”的担忧,相反,AI 技术的发展正在逐步朝着更加安全和可控的方向前进。

不足与展望

尽管这项研究为理解 LLM 的涌现能力提供了重要的见解,但研究人员也指出了该研究的局限性。

当前的实验主要集中在特定的任务和场景下,而 LLM 在更加复杂和多样化的情境中的表现尚需进一步研究。

研究人员表示,模型的训练数据和规模仍然是影响涌现能力的关键因素,未来的研究还需进一步探索如何优化这些因素,从而提高模型的安全性和可控性。

他们计划进一步研究 LLM 在更加广泛的语言和任务环境中的表现,特别是如何通过改进上下文学习和指令微调技术来增强模型能力,且确保安全性。

此外,他们还将探讨如何在不增加模型规模的情况下,通过优化训练方法和数据选择,实现涌现能力的最大化。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-08-19 12:45:01

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

对话伯克利顶级学者Stuart Russell:AI或在各方面超人类,对人类生存构成威胁
...人工智能:一种现代方法》的主要作者。划重点1. 大语言模型,在某种意义上跨越了很多的学科,机器人领域的人们正在尝试使用类似的技术,看看是否对机器人研发有帮助,但这是很难的一件
2023-06-14 13:00:00
人工智能研究院何积丰:大模型时代的隐私安全问题涉及到三个纬度
...到大学毕业大概需要十六年时间,而预计2026年前后,大模型就可以消化人类历史上所有有价值的文字数据。”何积丰说,“据不完全统计,人工智能的行业采用率达到60%左右,与各行业的
2024-02-03 16:19:00
大模型如何开始生成一个全新时代
...:北京日报与其说人类进入智能时代,不如说进入的是大模型时代——大模型如何开始生成一个全新时代朱嘉明会问问题比拥有知识更重要(摘自《大模型时代》)ChatGPT是人类科技史上的
2023-07-07 04:46:00
智能机器人展团:人形机器人“TA”会取代“我”吗? 扫码阅读手机版
...分是在受控环境下以预定义程序方式运行。如今,随着大模型技术的突破和快速发展,人形机器人基于语言大模型技术,逐步形成复杂任务与指令的理解、规划和执行能力;基于语音大模型技术,人
2024-07-17 13:50:00
解构AI安全产业链条、解决方案和创业机遇
图片来源@视觉中国文 | 自象限划重点:1、AI大模型的安全问题从来不是某一个单独的问题,它就像人的健康管理一样,是一个复杂的、体系化的,涉及多个主体和整个产业链的系统工程。2、
2023-06-06 11:00:00
...脑时代有Windows,移动互联网时代有iOS和安卓,AI时代有大模型。因为底层基础框架发生变化,所有现在看到的应用全部都会重塑,无论是社交、电商还是游戏等。“想象一下,当年
2023-09-19 10:00:00
OpenAI发布最新技术研究,AI“黑盒”不再是难题!
...随着ChatGPT在法律、金融、营销等领域的广泛使用,确保模型的安全、准确输出同时被很好理解变得非常重要。但由于神经网络的复杂和多变性,我们根本无法验证其生成内容的准确性,这
2024-07-18 09:47:00
阻止AI毁灭人类,OpenAI、微软、谷歌等公司共同成立“自治组织”| 最前线
...谷歌和Anthropic等四家AI领域巨头宣布成立行业组织“前沿模型论坛”(Frontier Model Forum)
2023-07-27 20:02:00
觉醒第一步吗 OpenAI模型在研究中违抗命令 竟然篡改关机脚本
据媒体报道,OpenAI现今最强大的人工智能推理模型“o3”被指在受到明确的人类指令时,拒绝执行关机操作。上周六(5月24日)
2025-05-26 23:23:00
更多关于科技的资讯:
因为AI的快速发展,过去一年里内存、硬盘和显卡都经历了显著上涨,对硬件终端的影响也终于爆发。开年以后,许多人发现多个品牌的笔记本电脑迎来了意想不到的涨价
2026-01-12 07:52:00
贯通生态,链接未来:ISPO Beijing 2026在京盛大开幕
2026年1月9日,亚太地区运动生活方式产业的开年风向标,ISPO Beijing 2026亚洲运动用品与时尚展于北京国家会议中心隆重启幕
2026-01-12 07:56:00
新年伊始,奋进正当时,在“十五五”开局的关键节点,山西转型综改示范区锚定发展目标抢订单、抓生产、拓市场,全力冲刺第一季度“开门红”
2026-01-12 07:05:00
近年来,音效设计行业在技术介入程度上的讨论不断增加。机器学习、区块链等技术的应用,使行业内部出现了关于“声音设计是否需要标准化
2026-01-09 14:49:00
“山情海韵 创见未来”青岛市崂山区第三届文创设计大赛作品火爆征集中,入围即享孵化赋能!
鲁网1月9日讯在黄海之滨、崂山脚下,千年文脉与现代潮流在此交融共生。为推动中华优秀传统文化创造性转化、创新性发展,助力崂山文旅高质量发展提质增效
2026-01-09 16:45:00
安徽人文讲坛丨人工智能:向新、向深、向未来
大皖新闻讯 人工智能正以前所未有的速度重塑人类社会,成为驱动全球科技革命、产业变革与国家竞争的核心力量。从历史纵深审视
2026-01-11 17:59:00
“返本还原第四回——小尺幅版画作品展”在省美术馆展出
江南时报讯(记者 钱海盈)由江苏省美术馆主办、江苏版画院(水印版画材料与技术研究文化和旅游部重点实验室)承办的“返本还原第四回——小尺幅版画作品展”正在江苏省美术馆展出
2026-01-11 15:13:00
邦德激光SK高速款激光切管机,引领高效切割技术新高度
在金属管材加工中,如何让设备在真正“高速”运行时,仍能保持“高精度”与“高稳定性”?单纯提升单项参数往往顾此失彼。邦德激光认为
2026-01-11 15:47:00
OPC“最强大脑”集结 高德空间智能开发者大赛全国总决赛在苏州落幕
江南时报讯 “‘智能遛狗小助手’帮你制定更合理的遛狗计划。”“出门旅游,帮你一站式行程管理。”“无障碍出行,AI轻松识别障碍物
2026-01-11 16:26:00
合肥创新院举办“汽车+”产业科创企业路演
大皖新闻讯 为搭建产业与资本的高效对接桥梁,推动汽车科技创新成果转化,助力创新创业企业成长,近日,2026“汽车+”产业科创企业新年路演在合肥创新院举办
2026-01-11 16:52:00
在吉林,机器人也开始“卷”滑雪了!
当双足机器人蹒跚滑下雪道,当机械臂在-20℃寒风中精准投出雪球……这些充满未来感的画面,如今正在吉林的冰天雪地里真实上演
2026-01-11 15:05:00
中新经纬1月11日电 国家医保局网站11日发布《国家医疗保障局办公室关于开展个人医保云建设试点申报工作的通知》(以下简称《通知》
2026-01-11 12:46:00
都市快报讯 昨天上午,上城区同协路旁的西子智慧产业园迎来了一名特殊的“保安”——身高1.8米,通体银色金属光泽,走起路来
2026-01-11 08:22:00
人形机器人“入职”前的试炼场来了杭州日报讯 核心提示2025年被称为人形机器人量产元年,今年人形机器人步入量产关键期,如何让机器人理解并适应人类真实的世界
2026-01-11 08:22:00
河北新闻网讯(崔梦露)1月8日下午,平安产险唐山中心支公司通过抖音、微信视频号、平安好车主、平安好生活等四大线上平台,举办“开年迎好运家家有平安”直播活动
2026-01-09 21:11:00