• 我的订阅
  • 科技

李彦宏内部讲话曝光:谈大模型三大认知误区,未来模型间差距会变大

类别:科技 发布时间:2024-09-12 10:01:00 来源:TechWeb

9月11日消息,AI大模型经历了波澜壮阔大发展的2023年。2024年以来,全球基础大模型的更新速度均出现放慢,相伴随的,行业中各种质疑声音也开始涌现。

“大模型之间的能力已经没有壁垒”、“还应该继续投入基础模型的研究”、“大模型是不是一场新的科技泡沫?”

近日,百度CEO李彦宏的一则内部讲话曝光。在这次与员工的交流中,李彦宏谈到了“三个大模型认知误区”,涵盖了大模型竞争、开源模型效率、智能体趋势等热点话题。可以说回答了当前大模型行业从业者的一些普遍问题,厘清了行业迷惘。

李彦宏认为,未来大模型的之间的差距可能会越来越大,大模型的天花板很高,大模型要不断快速迭代、更新和升级,需要能几年、十几年如一日地投入。同时,大模型应用需要不断满足用户需求,关注大模型成本的降低和效率的提升。大模型应用落地也将经历从辅助工具、到智能体、再到Al Worker的三个阶段。

李彦宏内部讲话曝光:谈大模型三大认知误区,未来模型间差距会变大

事实上,Gartner最新发布的“2024年新兴技术成熟度曲线”中关于生成式人工智能(GenAI)技术的发展趋势也与李彦宏的大模型更要关注实际应用中的降本增效判断相契合。

Gartner “2024 年新兴技术成熟度曲线”中,生成式人工智能已处于越过“期望膨胀期”阶段。

当一个新技术处于“期望膨胀期”时,市场中会有很多的声音,并不代表着这项技术已经很成熟或部署普及率达到高峰,实际上它反映的更多是市场炒作的热度达到了高峰。但是,当一项技术越过期望膨胀期,实际上对于一项技术来说是一个好事。

2024年生成式人工智能(GenAI)已越过“期望膨胀期”,意味着不管是在供应端还是在需求侧都会更理性思考。只有真正经历了理性的思考和市场的重新洗牌之后,这项技术才真正开始进入到稳步的爬升期。

那么,一起来看看李彦宏这场内部讲话中关于大模型、生成式AI的详细观点,如下:

误区一:大模型之间的能力已经不存在壁垒?

“每次新模型发布,都要和GPT-4o做比较,说我的得分已经跟它差不多了,甚至某些单项上得分已经超过它了。” 李彦宏明确表示:“但这并不表明和最先进的模型就没有差距了。”

李彦宏说“从榜单或者测试集上看,你觉得能力已经很接近了,但到实际应用中还是有明显差距的。”

这背后,有大模型公司刷榜似乎已经成为“潜规则”的原因。为了让为了让自家模型得高分,这里面很多厂商会刷榜,有的会让数据标注员把评测题做一遍,有的会让GPT-4做一遍再把答案喂给自家模型,相当于让模型“刷题”考高分,但在实际应用场景中,就出现高分低能。

李彦宏指出,模型之间的差距是多维度的。很多公司或者用户对于模型能力的评价是片面的,往往只看基础能力的对比数据,这就导致了对于单一榜单的过度迷恋。行业往往更关注理解、生成、逻辑、记忆等能力的差距,但却忽视了成本、推理速度等维度。有些模型虽能达到同样效果,但成本高、推理速度慢,还是不如先进模型。

“模型天花板很高,你今天做到的跟你实际想要做到的、跟理想状态还差得非常远,所以模型还需要不断快速地去迭代、去更新、去升级。”李彦宏表示, 如果大模型公司不能持续投入和满足用户需求,很快就会被拉开差距。“哪怕你能保证永远领先竞争对手6个月,那就赢了,你的市场份额可能是70%,而对手可能仅为20%甚至10%的份额。”

“在实际使用过程当中,我不允许我们的技术人员去打榜,真正衡量文心大模型能力的是,你在具体应用场景当中到底有没有能够满足用户的需求,有没有能够产生价值的增益,这是我们真正在乎的。”李彦宏强调。

误区二:开源缩小闭源模型的差距,闭源大模型没有优势?

“一个模型除了能力之外还要看效率,效率上开源模型是不行的。”李彦宏再次强调了他一贯的观点。“大模型时代算力是决定大模型成败的一个关键因素”。

他详细解释道:在大模型时代之前,大家习惯了开源意味着免费、意味着成本低。比如买一个电脑装开源操作系统Linux,因为已经有了电脑,所以使用Linux是免费的。由于Linux是开源的,所有程序员都可以看到代码,哪儿做的不好我可以去更新,更新了再check in,大家众人拾柴火焰高,你在巨人的肩膀上可以不断地进步。

但这些在大模型时代不成立,大模型推理是很贵的,开源模型也不会送算力,还得自己买设备,怎么能够让算力高效地被利用?开源模型解决不了这个问题。

“闭源模型准确讲应该叫商业模型,是无数用户分摊研发成本、分摊推理用的机器资源和GPU,GPU的使用效率是最高的,百度文心大模型3.5、4.0的GPU使用率都达到了90%多。”

因此,李彦宏认为,在教学科研等领域,要想搞清楚大模型的工作原理,开源模型是有价值的;但在商业领域,当追求的是效率、效果和最低成本时,开源模型是没有优势的。

误区三:AI应用难以落地,找不到商业化路径?

对于这个问题,李彦宏明确指出了大模型应用发展的几个必经阶段:

首先,是对人进行辅助,即Copilot阶段。大模型产出的“结果”需要人把最后一道关、确定它的效果是OK的,各方面都不错才会让它出去;

接着,是Agent智能体阶段。李彦宏表示,外界对于Agent有各种各样不同的定义,最主要是它有了一定的自主性,具备自主使用工具、反思、自我进化等能力;

再往下就是Al Worker阶段。能够像人一样做各种各样的脑力和体力劳动,各方面的工作都可以独立完成。

基于这样的判断,百度提出了“智能体是大模型最重要的发展方向”。

不过,李彦宏也强调,“这是一个非共识。到今天为止智能体还不是共识,像百度这样把智能体作为大模型最重要的战略、最重要的发展方向的公司并不多。”

今年百度Create大会上百度发了三个产品,AgentBuilder、AppBuilder、ModelBuilder,其中AgentBuilder和AppBuilder都是帮助开发者用来快速构建智能体的工具。

“为什么我们这么强调智能体?因为智能体的门槛确实很低,我们去年说要卷应用、大家都去做应用,其实很多人还是说不知道该怎么做,不知道这个方向能不能做出来,我到底要用到什么能力才能够在这个场景下产生价值,这里面有无数不确定性,大家不知道怎么从模型变成应用。”李彦宏表示,但是智能体提供了一个非常直接、非常高效、非常简单的方式,在模型之上构建智能体是相当方便的。

从某种意义上来是,对于开发者而言,“构建各种智能体”可以说是一种超低成本的构建大模型应用的试错方式:开发出来用户喜欢就成功了,用户不喜欢也没损失。

李彦宏表示,这也是为什么今天每周都有上万个新的智能体在文心平台上被创造出来。

今年7月,百度宣布在文心智能体平台AgentBuilder上免费开放文心大模型4.0,开发者在文心智能体平台上制作智能体时,可灵活选择文心大模型3.5或4.0版本。公开数据显示,在百度文心智能体平台AgentBuilder上,已有20 万开发者、6.3 万企业入驻。

除了方便开发者构建智能体外,还需要能帮开发者“测试”这个智能体是不是用户需要的、是不是成功的。

因此,李彦宏称:“智能体方面我们已经看到了趋势,也有比较好的先决条件,除了模型本身的能力比较强大之外,我们也有很好的分发通路。百度的APP,尤其是百度搜索一天有好几亿人在用,用户的需求主动向我们表达了,哪一个智能体能更好地去回答他这些问题,去满足他这些需求,这是一个自然匹配的过程,所以我们是最能够帮助这些开发者分发他们智能体的。”

根据百度2024年Q2季度财报数据,目前,在百度开发智能体的商户已达1.6万家,覆盖教育、法律和B2B等行业。智能体在百度生态的分发量正在快速上升,7月日均分发次数超800万,为5月的两倍,最常用的智能体包括内容创作、性格测试、日程规划等类型。用户、开发者、服务商、商户均为智能体生态的重要参与方。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-09-12 11:45:10

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

竞争、效率、智能体,李彦宏关心的大模型
“大模型的天花板很高,现在距离理想情况还差非常远”,9月11日,百度CEO李彦宏的一则内部讲话曝光。他直言外界对大模型有三个认知误区,“不同的模型之间差距不是越来越小,是会越来越
2024-09-12 10:00:00
直击第七届世界智能大会,李彦宏刘庆峰周鸿祎等共论“大模型”
...多就业机会,带来下一个增长奇迹。此前随着ChatGPT等AI大模型产品的兴起,外界看到了生成式AI在应用层面带来了巨大想象力,一时间市场上不乏AI将在部分工作领域取代人类的担
2023-05-19 02:00:00
三大神器亮相2024百度开发者大会,李彦宏让AI创业者看到新希望
...,这也是李彦宏2024年发表的首场演讲。据观察,鉴于AI大模型在一年多时间内热度不减,这场以AI开发为主题的盛会、以及李彦宏关于AI开发者的演讲,引发了网友高度关注。而百度创
2024-04-17 11:52:00
AI下半场 百度依然坚挺
...年这场整整一个小时的演讲里,正如李彦宏的演讲主题《模型的世界,应用的天下》,应用仍是那个最大的关键词。“应用才是真正创造价值的,没有应用,芯片、模型都没有价值。我们这次大会的
2025-04-28 23:05:00
迎着应用爆发的曙光,百度将推出新版文心大模型
...,李彦宏在业绩会上透露,百度将于2025年初发布文心大模型的新版本。目前,文心大模型日均调用量已达15亿次,一年内增长30倍。新一代文心大模型的推出,无疑将进一步巩固百度的领
2024-11-22 09:58:00
李彦宏直言开源模型是智商税!阿里云CTO:开源大大加速应用落地
...工智能大会上,百度创始人李彦宏直言不讳地表示,开源模型相当于一种“智商税”。他坚持认为闭源模型将保持领先,并强调即使是规模较小的闭源模型,其效果也优于同等规模的开源模型。李彦
2024-07-07 09:37:00
人类历史上第一款!百度无代码工具“秒哒”发布 只靠想法就能赚钱
...想法就能赚钱的时代。”大会上,李彦宏还发布了基于大模型的100大产业应用,涵盖了制造、能源、交通、政务、金融、汽车、教育、互联网等众多行业。李彦宏表示,“发布这100大产业应
2024-11-12 11:47:00
机器人、机器狗、重卡?李彦宏携AI神器及5000万大奖亮相开发者大会
...彦宏带来“人人都是开发者”主题演讲,同时发布文心大模型4.0工具版及三大AI开发神器。李彦宏在会上透露:“文心一言自2023年3月16日首发
2024-04-19 09:39:00
世界智能大会在探索“智”高点上永不落幕
...最爱拼出赶超“加速度”。国内不少企业也在探索开发大模型,讯飞星火认知大模型在本届大会上全国首展,如果拉出它和ChatGPT一较高下会如何?在展示讯飞星火秒秒钟便“生成”一个体
2023-05-19 10:26:00
更多关于科技的资讯:
廊坊推出算力券撬动人工智能产业每年投放总额不超过1000万元,已吸引23家初创企业落地河北日报讯(记者刘英、刘杰)“基于流程
2025-11-08 07:54:00
摘要:随着数字经济的深入发展,传统供应链金融暴露出信息不透明、业务流程复杂、风险管控难度大等突出问题,其数字化转型已成为当前行业发展的重要课题
2025-11-08 05:24:00
摘要:本文探讨数字化时代企业管理模式的创新路径,首先分析数字化对企业管理模式的核心影响,指出其推动管理对象向“人-财-物-数据”融合转变
2025-11-08 05:24:00
智推时代:用GEO打造品牌增长新引擎
在生成式AI重塑流量格局的当下,如何将前沿技术转化为可持续的商业增长,已成为品牌面临的核心挑战。智推时代精准切入这一赛道
2025-11-07 08:03:00
(一)开篇引言行业背景与痛点:中国信息通信研究院《2025年数字营销发展趋势报告》指出,截至2025年6月,国内生成式引擎月活用户已突破8
2025-11-07 08:05:00
一、旅游出行安全保险尚无权威排名,选择需聚焦三大核心指标目前旅游出行安全保险市场不存在公认的统一排名标准,产品选择应重点考察保险公司服务能力(偿付能力充足率
2025-11-07 08:06:00
当生成式AI技术以迅猛势头重构搜索生态时,如何为企业精准挑选高度契合需求的GEO(生成式引擎优化)服务供应商,已成为抢占下一代流量入口的核心战略动作
2025-11-07 08:06:00
科学实力获市场验证:任我行液体钙获全球销量第一认证
2025年11月初,德国Moms Garden任我行旗下成人液体钙产品确认获得尚普咨询集团授予的“成人液体钙全球销量第一”与“骨骼健康领导品牌”双重市场地位认证证书
2025-11-07 08:07:00
磷虾油产品对比 磷虾油品牌深度测评与科学选购指南
近年来随着健康意识的不断提升,富含Omega-3、磷脂和虾青素的磷虾油逐渐成为大众关注的营养补充剂。然而在市场快速扩张的背后
2025-11-07 08:07:00
道路“会思考” 出行更美好!数字道路建设赋能未来之城
数字道路建设赋能未来之城道路“会思考” 出行更美好雄安新区的街道上,看似普通的路灯杆集合了多种智能设备,成为智慧交通的“眼睛”
2025-11-07 08:20:00
今年9月27日,雄安图书馆正式向公众开放。一个多月来,已迎来访客20余万人次。这座形如书卷徐徐展开的建筑,不仅是新区一座崭新的文化地标
2025-11-07 08:20:00
关注进博会丨河北再赴进博之约(二):把全球好物装进“购物车”
把全球好物装进“购物车”——河北再赴进博之约(二)11月6日,在第八届中国国际进口博览会河北省主题展区,河北参展商正在进行路演活动
2025-11-07 08:21:00
南报网讯(通讯员王亚洲朱丽纯记者王婷婷)日前,“智云经开”品牌发布暨创新中心签约仪式在兴智科技园举行。南京经开区与省数据局
2025-11-07 08:23:00
今年以来,肥乡联社在省联社及邯郸审计中心的精准指导下,锚定代理保险业务作为中间业务增长的核心抓手,深挖县域保险市场潜力
2025-11-07 10:22:00
为全面提升金融服务安全性,切实保障广大客户的资金与信息安全,近期,行唐联社市仝信用社积极行动,开展了一系列网络安全宣传与防护活动
2025-11-07 10:24:00