• 我的订阅
  • 财经

黄仁勋对话Transformer七作者:很多计算资源被浪费,世界需要更好的模型

类别:财经 发布时间:2024-03-21 21:12:00 来源:澎湃新闻

澎湃新闻编辑 秦盛(01:35)

黄仁勋对话Transformer七作者:很多计算资源被浪费,世界需要更好的模型

黄仁勋 IC 资料图

AI(人工智能)大模型奠基之作Transformer论文的七位作者与英伟达CEO黄仁勋一起讨论生成式AI的过去、现在与未来。

当地时间3月21日,提出了Transformer架构、改写AI领域发展历程的论文《注意力就是你所需要的一切(Attention Is All You Need)》的作者们现身英伟达GTC大会,在名为Transforming AI(变革AI)的圆桌会议上与黄仁勋一起展开了同台讨论。

除了因临时变故而无法前来的Essential AI的联合创始人Niki Parmar外,其余七位作者都来到了现场,这是他们首次在公开场合集体亮相。这场会议也是黄仁勋在整个GTC大会上除了主题演讲以外,唯一一场公开的活动。

在开场白中,黄仁勋表示,虽然计算技术自1964年以来都没有发生根本性的改变,但计算机的边际成本持续下降,以至于在二十年的时间里,计算机的成本几乎降低了一万倍。然而,计算机成本的下降已经到达了一个临界点,逐渐趋向于停滞。

而在那之后,生成式AI的诞生为行业带来了新的希望,能够为我们解读数据背后的含义,是“一次全新工业革命的开始”。毫无疑问,Transformer架构的出现在这一过程中起到了非常重要的作用。黄仁勋表示:“你不会想要错过接下来的十年。”

划时代的论文《注意力就是你所需要的一切》由谷歌Brain团队的八位研究者发布于2017年。这八位研究者已经陆续离开了谷歌,几乎都创办了自己的公司,并仍在从事AI相关工作。

来到现场的七位论文作者分别是:全栈型智能产品开发商Essential AI的CEO阿希什·瓦斯瓦尼(Ashish Vaswani),AI生物技术提供商Inceptive的CEO雅各布·乌斯克雷特(Jakob Uszkoreit),区块链公司NEAR Protocol的联合创始伊利亚·波洛苏欣(Illia Polosukhin),AI聊天机器人平台Character.AI的联合创始人兼CEO诺姆·沙齐尔(Noam Shazeer),AI初创企业Sakana.ai的联合创始人兼CEO利昂·琼斯(Llion Jones),AI初创企业Cohere的联合创始人艾丹·戈麦斯(Aidan Gomez),以及被黄仁勋调侃为“唯一还在从事程序员工作的英雄”、OpenAI研究员卢卡什·凯泽(Lukasz Kaiser)。

黄仁勋对话Transformer七作者:很多计算资源被浪费,世界需要更好的模型

黄仁勋和原计划参加会议的“Transformer论文八子”。来源:英伟达

在这场时长不到一小时的讨论中,八人都表现得较为放松,将谈话重点放在对AI未来的展望上,也披露了一些关于Transformer创建初期的往事。

所有的机器学习都是“transformer(变革者)”

所谓的Transformer模型,其实是一种基于自注意力机制的神经网络模型,能够用于处理序列数据。相比于传统的循环神经网络模型,Transformer模型能够更准确地捕捉单词的上下文和含义,因而成为了像GPT-4和ChatGPT这样的大语言模型的基础,同时也被应用于非语言领域,包括OpenAI的AI代码生成训练模型Codex、文生视频模型Sora和谷歌DeepMind的蛋白质折叠结构预测模型AlphaFold。

据几位研究者介绍,在开发Transformer之前,他们注意到随着模型规模的增大,其智能程度也随之提高,而递归神经网络(RNN)处理大量信息的效率并不高,激发他们去寻找能够真正迅速处理信息的模型。沙齐尔表示:“我喜欢把Tansformer比作是从蒸汽机到内燃机的飞跃。我们也可以用蒸汽机实现工业革命,但那会非常痛苦,而内燃机让一切都变得更好。”

而对于“transformer”这一名字是如何确定下来的,乌斯克雷特称几人只是“随便起了一个名字”,觉得它很有创意,因为所有的机器学习都是“transformer(变革者)”。

琼斯表示:“但我们确实意识到,我们实际上是在尝试创造一种非常通用的东西,它真的可以将任何东西都转化成其他的任何东西。我们并未预测到,当Transformer被用于图像时会有这么好的表现,这有些令人惊讶。”

“世界需要比Transformer更好的东西”

不过,Transformer的创造者们已经开始把目光放得更远,转向AI的下一个阶段。

戈麦斯表示,在这一点上,“世界需要比Transformer更好的东西”:“我认为,我们都希望它被一些能将我们带到更新性能高度的东西所取代……你们认为接下来会发生什么?这是令人兴奋的一步,因为我认为(现在的发展)太像六七年前就存在的东西了。”

对此,琼斯指出,为了让AI行业在Transformer之后进入下一个阶段,从业者 “不仅需要做得更好,你还必须非常明显地做到更好……(我们)还停留在原始模型上,尽管从技术上讲,它可能还不是我们现在拥有的最强大的东西。”

琼斯补充道,每个人都知道自己想要什么样的个人工具,例如更大的上下文窗口、更快地生成token的能力:“我不知道你们喜不喜欢这个说法,但人们现在使用了太多的计算量,我认为大家浪费了很多计算资源。”

随后,黄仁勋也邀请几人介绍自己现在所在的公司。几位创业者基本都提到,希望能让AI技术走出实验室,让这项能够改变世界的技术尽快被更多人运用,并同时降低其成本。

作为第一个离开谷歌的人,选择研究区块链技术的波洛苏欣表示:“我坚信,我们正在向着实现几乎整个世界的软件化进步,而机器学习就是软件的一部分。因此,最直接的方法是教会机器编码,这样你就能够生成软件,并改变所有人的访问方式。”

当琼斯谈到推理是“下一个重要的发展方向”,其他研究者都进行了附和。凯泽指出,在未来,作为“与现实世界互动的地方”,数据的质量将变得更加重要:“我认为将会出现一个新时代,仍然会有一些免费的预训练模型,但重要的可能将是那些更大型的、高质量的东西。”

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-03-21 23:45:05

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

黄仁勋对话Transformer七子:我们被困在原始模型里,还需要更强大的新架构
...中所提出的Transformer架构,为当下大热的ChatGPT、Gemini等大模型打下基础,人工智能领域从此变天
2024-03-22 00:03:00
知乎 AI 革命:智能搜索与实时问答的融合
...何看待知乎当下和未来,有三个基本的视角:它是大语言模型预训练中文语料最重要来源之一,例如最近现象级的大模型聊天应用 Kimi Chat,就以知乎为重要的训练资料来源(甚至是
2024-03-31 21:00:00
3大关键词,解读全球首个万字创作大模型“中文逍遥”
...整的故事。”这是一个普通的文学爱好者,向一个创作大模型提出的问题。根据这个想法,大模型快速生成了故事框架概要和章节结构。3分钟后,这部大模型写的小说字数已经超过1.2万,行文
2023-10-16 14:49:00
中新经纬7月8日电 (常涛)由ChatGPT引发的大模型热潮还在持续,在6日开幕的2023世界人工智能大会(下称大会)上,大模型站上“C位”。对于大模型的未来发展图景,用户亦充满
2023-07-08 10:48:00
对标GPT-4o!商汤发布两大国内首个大模型 入局价格战
...主力产品,国内首个真C端可用、可控的人物视频生成大模型。而更有颠覆性的是国内首个所见即所得的模型——商汤“日日新5o”,实时多模态流式交互对标GPT-4o,开启了全新的AI交
2024-07-09 09:46:00
对话Adobe 3D负责人尹珊:大模型会渗透到核心产品中,十月将发布融合AI的3D工具
...含了5款专业级创意软件和一套综合性高阶 3D 资产库,从模型、材质、场景布置、渲染到发布,覆盖 3D 创意全流程。尹珊介绍,Adobe的3D解决方案是一个从前端建模到后端产品
2023-08-05 02:00:00
掌阅科技入选北京市通用人工智能大模型应用场景需求榜单
...聊”作为优秀案例,在论坛举办的北京市通用人工智能大模型行业应用典型场景案例发布仪式上发布。同时,掌阅科技还入选了北京市通用人工智能大模型应用场景需求榜单和北京市通用人工智能产
2023-07-03 16:00:00
...惊艳而来的,还有当时外界对几乎所有AI公司的质疑。大模型走红后,不论是计算机视觉、语音识别,亦或基于垂直任务的自然语言理解,都被统称为“上一代AI”。在36氪今年的交流中,就
2023-07-27 11:54:00
对话科大讯飞刘庆峰:国内大模型发展要推动自主可控,国外算力难以保证安全
...品 | 搜狐科技作者 | 梁昌均距5月6日首次发布星火认知大模型后,科大讯飞在8月15日迎来“百日会战”节点。在这次发布会上,星火大模型V2.0在代码和多模态能力上实现突破,
2023-08-16 18:00:00
更多关于财经的资讯:
讯联液压项目基本建成
日前,江宁开发区市级重大项目讯联液压高端液压核心部件项目基本建成,正全力冲刺年内试生产。该项目聚焦高端液压部件制造,目前主体封顶
2025-10-20 07:44:00
建行烟台分行 零钱兑换里的民生暖意
胶东在线10月16日讯(通讯员 祝宏)近日,一位手提三个布袋的客户局促地站在了建行烟台分行南大街支行门口。“这是开超市攒的零钱
2025-10-20 05:39:00
科技赋能 装备美好丨山东重工·潍柴动力全球合作伙伴大会在青岛召开
10月18日,以“科技赋能 装备美好”为主题的山东重工·潍柴动力全球合作伙伴大会在青岛红岛国际会展中心盛大启幕。青岛市委副书记
2025-10-19 10:25:00
2025年全国农产品产销大会|龙大哥辣子鸡创始人李顺利:用美味干锅传递贵州热情
“贵州干锅,以‘干香’为魂,‘热辣’为韵,讲究食材先炒后煮,其味道浓郁奔放,完美展现了贵州人热情豪爽的性格特质。”10月17日
2025-10-19 10:55:00
贵阳花溪区职业指导进校园系列活动助力毕业生扬帆起航
10月16日,“花式引才·溪望你来”2025年花溪区职业指导进校园系列活动走进贵阳人文科技学院。活动特邀职业指导专家武星为该校经济与管理学院2026届198名毕业生开展专题授课
2025-10-19 14:02:00
2025年全国农产品产销大会丨“老凯俚酸汤鱼”创始人丁文建:用酸汤传递贵州的纯粹与自然
“‘三天不吃酸,走路打蹿蹿。’这句话生动道出了贵州人对酸汤的深厚情感。”10月17日,在贵州“三锅演义”生态黔菜推介会上
2025-10-19 14:02:00
2025年全国农产品产销大会丨夏光忠:走出一条具有“六枝”辨识度的土特产“出山路”
“立志把农产品电商做到极致,通过不断优化运营模式,提升服务质量等,走出一条具有‘六枝’辨识度的土特产出山之路,将小黄姜
2025-10-19 14:03:00
贵阳花溪区举办高校毕业生入企体验活动
10月15日,花溪区人力资源和社会保障局举办“助力攻坚·就创青春”2025年高校毕业生入企体验活动。本次活动组织区内30名高校毕业生等青年人才走进辖区企业
2025-10-19 14:03:00
2025全国农产品产销大会丨黄庆满:让一杯贵州牛奶走进千家万户
“我们今年的目标是直播团队实现销售额5000万元,让更多消费者通过一杯贵州牛奶,认识贵州、信任贵州、爱上贵州。”10月18日
2025-10-19 14:03:00
“以前要跑好几趟,现在服务到身边”|回眸“十四五”·高质量发展这五年
日前,德耐尔节能科技公司贵阳分公司负责人手握一纸证明,欣喜之情溢于言表:“7个工作日,超乎预料。”通过南明区“企业上市合法合规信息核查一件事”服务
2025-10-19 21:50:00
2025年全国农产品产销大会丨省商务厅副厅长朱霖毅:开拓黔菜产业高质量发展蓝海
“‘生态黔菜·美味健康’不仅是一句口号,更是一个巨大的市场机遇和一份沉甸甸的产业邀请。我们热切期待,以本次产销大会为纽带
2025-10-19 14:03:00
今年1-9月 厦门开具发票销售金额同比增长7.17%
厦门网讯(厦门日报记者 陈泥 通讯员 徐然)厦门市税务局发布的最新税收数据显示,今年1—9月,全市开具发票销售金额同比增长7
2025-10-18 08:59:00
前三季度福建对其他金砖国家出口破千亿元
【我省深挖“金砖”商机】民营企业成“主力军”前三季度,福建省民营企业对其他金砖国家出口725.9亿元,同比增长7.8%
2025-10-18 08:59:00
港口航运板块“抢滩”风口 相关概念股热度升温
近日,港口航运股逆市走强,成为A股市场亮点之一。板块内多只概念股持续活跃,中远海特、招商南油股价均连续三周收红。业内人士认为
2025-10-18 10:41:00
边风炜:调整很正常 但也很煎熬
本周市场迎来调整,或者不应该叫调整,说震荡更合理,因为上证指数几乎没有跌,一度还临近前高,不过双创指数跌了一些,整体市场投资者的感受不太好
2025-10-18 10:41:00