• 我的订阅
  • 科技

OpenAI CEO宣布转向,“大模型时代”即将结束?

类别:科技 发布时间:2023-04-20 10:33:00 来源:电厂

OpenAI CEO宣布转向,“大模型时代”即将结束?

记者 张勇毅

编辑 高宇雷

4月19日,虽然在这个月几乎每周都至少有一家科技大公司入局训练大模型,但OpenAI 却突然改变了方向声称,大模型时代已经要结束了。

上周末在麻省理工学院,OpenAI 的 CEO 在演讲中警告称:我们已经处在大模型时代的尾声,并表示如今的 AIGC 发展中,将数据模型进一步做大,塞进更多数据的方式,已经是目前人工智能发展中最后一项重大进展,并且还声称目前还不清楚未来的发展方向何去何从。

消息传出,立即引发很多外界的质疑,OpenAI 本身已经是大模型技术领域最前沿的研究机构,为何会说出这种能让研究方向180度掉头的论调?

在如今的生成式 AI 背后的技术,称其为大模型甚至已经不够准确,这些模型所需的参数数量已经是天文数字,称其为「巨型模型」或许更加准确。

OpenAI 最早的语言模式是 GPT-2,于 2019 年公布,发布时就有 15 亿个参数,此后随着 OpenAI 研究人员发现扩大模型参数数量能有效提升模型完善程度,真正引爆 AI 行业浪潮的 GPT-3 发布时,参数数量已经达到了 1750 亿个。

截至目前,OpenAI 并没有公布最新迭代版本 GPT-4 所用的参数数量。但外界普遍估算其包括的参数量已经达到了 GPT-3 的二十倍 —— 3.5万亿个参数。

但人类互联网历史上被保留下来的各种高质量语料,已经在 GPT-3 以及后续发布的 GPT-4 的学习中被消耗殆尽。大模型参数数量仍然可以继续膨胀下去,但对应数量的高质量数据却越来越稀缺,因此增长参数数量带来的边际效益愈发降低。这如同 AI 行业的「摩尔定律」一般。

除了大模型本身的技术发展方向,Altman 提到的另一个问题:购买大量 GPU 以及建设数据中心的物理限制以及高昂的成本,或许才是更多 AI 大模型开发公司现在所面临的切肤之痛:运营巨型数据服务中心成本高昂已经是行业公认,但如果是用于 AI 大模型训练则更是贵上加贵,无论是对电力还是水力的消耗都极其巨大。

OpenAI CEO宣布转向,“大模型时代”即将结束?

即使是 GPT-4 或 New Bing,也多次因为算力不足不得不公开宣布短时间内暂停访问。算力已经成为限制 AIGC 进一步拓展使用场景的关键桎梏。Altman 的说法的根据,或许也有很大一部分来源于 OpenAI 所面临的现实原因。

在今年三月,英伟达专用于大模型参数计算、采用专用 Transformer Engine 架构的英伟达 H100NVL 系列发布之后,从中嗅到商机的黄牛也开始借机炒价,售价已经飙升至四万美元。但这些在当下大模型技术巨大的风口面前似乎都不值一提,目前 H100NVL 系列仍然处于一货难求的状态。马斯克也在 Twitter 上惊呼「似乎每个人和他们的狗都在抢购 GPU」。

OpenAI CEO宣布转向,“大模型时代”即将结束?

不过吐槽归吐槽,即便是马斯克也不得不为了自己新成立的 AI 公司而买买买:据《商业内幕》报道,马斯克已经购入了一万组英伟达最新发布的 GPU 并运至数据中心。并在 Twitter 上声称将开发 TruthGPT 来挑战 ChatGPT。

OpenAI CEO宣布转向,“大模型时代”即将结束?

尽管 Altman 同时还在演讲中表示「OpenAI 目前没有在开发 GPT-5」。但在 AI 大模型发展狂奔的路上,没有人愿意真的成为「落后六个月」的那个。

根据分析机构 SemiAnalysis 估算,如果按照目前 ChatGPT 的运算处理效率,想要承担 Google 搜索目前在全球全部访问流量,至少需要 410 万张英伟达 A100 GPU。即使只是训练出目前 ChatGPT 能力的大模型,也需要超过 10000 个 GPU 来完成,后续运营维护还需要更多。

这也是如今几乎你能见到的每个大模型产品都需要「内测邀请码」的原因:不仅训练这些大模型烧钱,运营起来更加烧钱。

这种对于计算硬件极度迫切的需求,推动着英伟达成为这个市场最大的垄断者。如今英伟达已经占据了计算卡 88% 的市场份额,其他选项 —— 例如 Google 开发的 Tensor TPU,甚至不提供对外售卖的选项。

但正如马斯克「嘴上说暂停训练半年,实际光速成立 AI 公司」一样,在很大程度上,这也只是 Altman 的一家之言。如今很多后来者的技术发展程度都还远未到能说出「AI 发展不能靠无脑计算」的程度。但 Altman 所说的确实已经成为如今头部大模型开发公司正在/即将要面对的棘手问题。

「一味不计成本地堆砌硬件不是未来」已经成为越来越多业内人士的共识。

现在的 AI 发展阶段,甚至很多地方都有着互联网发展早期时代的即视感:AI 行业的发展也已经出现了「摩尔定律」,训练大模型所需的大量 GPU 组成的硬件训练集群,与世界上第一台计算机并没有本质上的区别。

OpenAI CEO宣布转向,“大模型时代”即将结束?

人工智能也需要一次「半导体革命」,探索未来也需要更加高效的方式:或许对大模型参数数量的精简,以及利用多个较小的模型实现处理能力的提升,会是大模型时代结束之后,AIGC 行业的下一个发展方向。

在 ChatGPT 发布之初,针对参数量过高以及关于道德伦理方面的问题,OpenAI 曾公开过一项新的研究:使用一种通过人类反馈来强化学习 (RLHF) 的技术,对模型数据进行微调。

经过超过一年的测试,OpenAI 由此生成了 InstructGPT,其模型参数量仅有 13 亿,只不到原版 ChatGPT 的百分之一,但这个迭代款不仅表现出更准确的回答能力,甚至在回答中关于事实核查以及负面内容的表现,要好于 ChatGPT 本身。

OpenAI CEO宣布转向,“大模型时代”即将结束?

此外,同样近期大火的 AutoGPT:使用 GPT-4 作为底层技术,加入了从网页中抽取关键信息的能力,根据返回的结果进一步执行命令,帮你自动完成任务处理。突破了只能处理文本相关内容任务的限制。

由此诞生的结果,就是用户在 AutoGPT 的实际使用中都能明显感受到,要智能的多的结果,甚至完完全全改变了原本 ChatGPT 常规的使用方式,比如 AutoGPT 能自动完成一整个网页的代码实现,甚至还有网友发现 AutoGPT 为了完成最初的任务目标,自行在招聘网站上发布了招聘广告,吸引其他人来辅助完成。

OpenAI CEO宣布转向,“大模型时代”即将结束?

这些在应用层面的创新,除了能为大模型技术探索更多的应用场景,也是在 AI 领域探索现有算力之下发展的可能。基于人类反馈实时修改结果的最直观体验,就是让人工智能变得更加聪慧,同时也是真正意义上能实现「一个人就是一个团队」的技术。

宏观来看,即使当下大模型技术对于 AIGC 的发展至关重要,但长远来讲,AI 绝不会永远依赖大模型的参数提升以及堆砌算力来构建未来,开发更小更精准的模型,以及更加具体的应用场景,或许已经是下一个时代真正的方向。

届时,或许是大模型时代的结束,却是人工智能时代真正的开始。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-04-20 11:45:24

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

贾扬清:大模型尺寸正重走CNN的老路;马斯克:在特斯拉也是这样
Transformer大模型尺寸变化,正在重走CNN的老路!看到大家都被LLaMA 3.1吸引了注意力,贾扬清发出如此感慨
2024-08-02 09:47:00
马斯克打脸OpenAI!全球最大模型Grok-1开源
...:林志佳马斯克(Elon Musk)真的实现了他的承诺——把大模型Grok-1开源了。钛媒体App获悉,北京时间3月18日早上
2024-03-20 13:44:00
小米造车,AI先行,雷布斯变身“雷斯克”?
...的智能驾驶也撩开神秘面纱,自适应变焦BEV技术、道路大模型、超分辨率占用网络技术三项关键技术同时曝光,与特斯拉FSD对标的野心一览无余。据雷军透露,在智能驾驶技术上,小米第一
2024-01-04 11:09:00
AI新闻早知道!马斯克、黄仁勋动作不断,AI手机也要普及了
...久没有出现过像AI这样轰动的技术了,自从OpenAI领衔的大模型出现后,AI迎来爆发式增长,先是ChatGPT,再到今年的Sora
2024-03-24 17:49:00
马斯克官宣Grok-2测试版!xAI将继续拥抱开源路线吗?
继旗下xAI公司宣布正式开源大模型Grok-1后,特斯拉CEO马斯克再次在大模型市场扔下一颗重磅炸弹。当地时间8月11日晚
2024-08-13 09:50:00
“言出必行”马斯克,全球最大开源模型Grok真的来了
刚刚开源的 Grok,一举拿下迄今为止“全球最大开源模型”称号。马斯克又搞了个全球第一。Grok开源美东时间3月17日
2024-03-18 11:50:00
马斯克承诺开源版大模型 来了!Grok-1:3140亿参数迄今最大,权重架构全开放
...之心开源社区有福了。说到做到,马斯克承诺的开源版大模型 Grok 终于来了!今天凌晨,马斯克旗下大模型公司 xAI 宣布正式开源 3140 亿参数的混合专家(MoE)模型‘Grok-1’
2024-03-18 11:51:00
马斯克xAI发布首款大模型;苹果发布M3芯片;ChatGPT被曝仅200亿参数|本周硅谷发生了什么?
...则意外曝光ChatGPT实际参数仅有200亿,引起一片哗然。大模型这边,马斯克旗下众星云集的xAI发布了首款大模型“Gork”
2023-11-05 17:03:00
马斯克感慨硅谷AI人才争夺疯狂 万兴科技百万年薪邀人才共赴AI大时代
...推特平台直接访问。3月中旬,xAI将 3140 亿参数的 Grok-1 大模型开源,成为当前参数量最大的开源大语言模型
2024-04-15 20:00:00
更多关于科技的资讯:
□南京日报/紫金山新闻记者卫凌云 通讯员建萱江岛宣不需要司机和快递员,只需通过手机下单,无人物流车便可上门进行商品配送
2025-08-20 07:42:00
人在江宁,“飞”阅玄武湖
第九届未来网络发展大会探展人在江宁,“飞”阅玄武湖□南京日报/紫金山新闻记者张安琪实习生饶嘉萱选择点位玄武湖、打开无人机机箱
2025-08-20 07:42:00
京津冀共推新能源汽车、低空装备产业协同发展提高科技成果转化和产业化水平河北日报讯(记者米彦泽)8月12日,京津冀新能源和智能网联汽车
2025-08-19 08:31:00
解码“小镇冠军”丨广饶县大王镇:一纸风帆闯世界的底气
大众网记者 孙淑娟 东营报道世界造纸,中国领航;中国造纸,广饶担当。在黄河三角洲的沃土上,广饶县依托深厚的产业积淀,崛起为全国举足轻重的高端造纸产业基地
2025-08-19 08:51:00
当我们怀念“上行时期的美”,是在怀念一种向上的状态
最近,一个词在网上悄然走红 ——“经济上行的美”。当全球经济增速放缓,这个词的流行,本质上是大众借由对 “黄金年代” 的集体记忆
2025-08-19 09:03:00
马可波罗IPO上市注册:创新驱动新引擎,引领高质量发展趋势
在日新月异的今天,科技创新已成为推动各行各业发展的关键力量。陶瓷行业,这一承载着千年文明与历史沉淀的传统产业,在新时代的浪潮中
2025-08-19 09:51:00
为提升从业人员的专业素养与服务水平,中国人寿深州支公司开展销售人员培训活动,此次培训特邀公司经验丰富的业务精英与兄弟县市优秀讲师
2025-08-19 09:58:00
为深化全员对代理保险产品的认知,提升精准营销能力,加速拓展市场份额,8月8日下午,滦州农商银行召开2025年下半年代理保险业务专题培训会
2025-08-19 10:04:00
从“好内容”到“好转化”,巨量引擎小游戏迈入“精耕时代”
随着供需两端提速,以及AI的全面入局,一个小游戏崭新的增长时代正在展开。2025 ChinaJoy期间,由中国音像与数字出版协会和上海市虹口区人民政府联合主办的「2025 CIGDC 中国国际游戏开发者大会」在沪举行
2025-08-19 10:52:00
小猿学练机独家引进海尼曼FPC AI+全球顶级资源打造英语学习新范式
近日,教育科技领军品牌小猿学练机在北京举行“小猿学练机×海尼曼”战略合作发布会,宣布学习平板领域独家引进全球知名的 “海尼曼 FPC ”分级阅读体系
2025-08-19 10:52:00
WRC 2025开普勒K2大黄蜂实力吸睛,商业化进程继续加速
2025年8月8日至12日,2025世界机器人大会(WRC 2025)在北京经济技术开发区北人亦创国际会展中心举行。围绕 "让机器人更智慧
2025-08-19 10:52:00
韩国农水产食品流通公社助力姚琛“万里挑一 特别派对”
-以美食为桥深化中韩文化交流-2025年8月9日,内地人气歌手姚琛“万里挑一 特别派对”在北京市昌平区丘比特露营营地火热开唱
2025-08-19 10:52:00
近年来,伴随着出海浪潮不断升温,中国商品正加速迈入高质量、品牌化发展的新阶段。面对出海新趋势,近日,由中国(宁波)跨境电子商务综合试验区
2025-08-19 10:59:00
本报讯 (记者 解 磊)近日,记者从中国塑料加工工业协会(以下简称“中国塑协”)获悉,干法锂电池隔膜骨干生产企业负责人闭门座谈会在深圳召开
2025-08-19 11:03:00
2025第四届山东跨境电商交易会将于10月在烟台举办
在全球贸易格局深刻变革的浪潮中,跨境电商正以惊人的活力重塑国际贸易链路。据权威机构预测,2025年全球电商渗透率将突破25%
2025-08-19 11:16:00