• 我的订阅
  • 科技

百度首次现场演示大模型微调过程,「文心一言」调用成本下降90% | 最前线

类别:科技 发布时间:2023-05-10 16:58:00 来源:36氪

文 | 周鑫雨

编辑 | 苏建勋

在大模型“扎堆”发布的当下,市场亟需更直观的方式,对模型能力做出判断。

2023年3月16日,在百度文心一言的发布会上,模型采用的是录播Demo的演示形式。在36氪的专访中,百度CEO李彦宏给出了理由:

“一是生成式AI每次给出的答案不一定一样,会带来不确定性。二是真正说服我的理由,是全球所有类似发布会,没有一个是现场演示的,都是录好的。如果大家都可以,那我们也OK。”

5月9日,在时隔一个多月的技术交流会上,百度一改保守的风格,带来的是对“文心千帆大模型平台”能力的现场演示。

百度于2023年3月27日推出的文心千帆大模型平台,是集合了文心一言服务调用、第三方模型训练、调优服务和工具的一站式平台。其服务主要分为公有云服务和私有化部署两部分,公有云服务主要包括文心一言推理能力调用、模型微调、模型托管,私有化部署则包括软件授权、软硬一体和租赁服务。

此次现场演示,百度主要展现了文心千帆的推理能力调用和模型微调两部分。

百度首次现场演示大模型微调过程,「文心一言」调用成本下降90% | 最前线

文心一言Sugar现场生成了销售额的饼图。

从演示结果来看,文心一言下属的数据可视化应用Sugar能够对结构化的数据集进行理解,并快速输出饼图。面对模型无法理解的“画折线图”需求,百度程序员则通过文心千帆大模型平台的微调功能,导入100条标注数据后对Prompt进行了现场改写,从而实现了折线图功能。

百度首次现场演示大模型微调过程,「文心一言」调用成本下降90% | 最前线

文心千帆支持模型微调。

这也意味着,文心千帆已经能够通过仅100条左右的少量标注数据,高效完成模型的微调及定制化。百度智能云AI与大数据平台总经理忻舟表示:“它(文心千帆)通过图形化的界面,为大家提供非常好的大模型训练推理和应用的平台——我们不需要去了解代码,也不需要做命令行的操作,我们只需要关注到最核心的业务数据、业务应用,在文心千帆平台上去做各种训练和调优。”

与此同时,AI时代的“向内革命”也正在百度内部悄然发生,百度搜索、推荐、地图、如流、小度等产品已经接入了文心一言。

百度首次现场演示大模型微调过程,「文心一言」调用成本下降90% | 最前线

百度内部办公软件“如流”上线了AI小助手。关于行业大模型训练成本,小助手给出的回答是“10万-50万卡时”。

百度集团副总裁侯震宇表示,对客户而言,成本和模型性能才是评价大模型的两项指标。

“训练一个大模型,动辄三个月,一两千万美元,假如每一个企业都需要付出这么高的代价,门槛那么高,显然百度也不会进入这个市场。”他表示,即便从头训练模型的成本依然高昂,但是使用大模型、以及基于大模型底座训练和微调模型的成本已经有显著的降低,“现在调用文心一言的成本,已经降低到模型刚发布时(3月16日)的10%”。

近日谷歌内部流出的一份文件表示,未来OpenAI和谷歌等厂商开发的闭源大模型将不可避免地受到开源模型的冲击。有其随着Meta自研的大模型LLaMa泄露,围绕这一基座的开源模型生态正在迅猛地发展。文件还提到,企业可以免费使用开源模型,并且更加灵活可控。“我们没有壁垒,OpenAI也没有”。

“大家觉得大模型成本非常高,是因为大模型算力成本高,其次是大模型数据成本。开源模型也绕不开大量的GPU,所以并不是开源成本一定低。”侯震宇则向36氪给出了相反的答案。

他认为,免费开源模型的调用成本并不意味着更低:“一方面,一般企业不见得能够用得起两三千张集群卡,另一方面是不一定能够用好,在这么大的集群量中如果出现了BUG很难调整,需要有整体的调优服务能力。大模型贵是因为量大且训练时间长,在成本这方面,最终要看是否有整体端到端的成本控制能力,这样一定会比纯粹去买成本要低。”

随着大模型的落地逐渐从“摸石过河”走向实践的“中场战事”,低成本和高性能将是不同大模型厂商不断演练的课题。

百度首次现场演示大模型微调过程,「文心一言」调用成本下降90% | 最前线

36kr制图

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-05-10 19:45:13

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

抢占大模型红利,28家企业成为文心千帆大模型平台生态伙伴
抢占大模型红利,28家企业成为文心千帆大模型平台生态伙伴 5月18日,百度智能云在广州举行2023百度智能云合作伙伴大会,向在场的300家政企客户展示文心大模型在场景应用、生态建
2023-05-19 16:18:00
文心一言发布百度市值蒸发200亿,外界称缺乏亮点,应用前景难超ChatGPT
...品 | 搜狐科技作者 | 梁昌均刚刚发布了“国产版ChatGPT”文心一言(ERNIE Bot)的百度,步入谷歌的后尘
2023-03-17 10:00:00
我在百度大模型应用升级里,找到了企业增收提效的最佳路径
...答卷。▲百度智能云副总裁喻友平 具体来说,甄知基于文心大模型重构了企业知识管理流程,实现知识接入-加工-组织-应用更快更准,可10分钟快速搭建一个专业级知识助理;客悦针对客
2024-06-27 09:21:00
「文心一言」对外开放后:一句话让AI找到工作文件,数字人实现小时级换装 | 最前线
...型最具价值的应用场景进行了总结。如今看来,这更像是文心一言的一场产品预告。顺着获批开放的东风,9月5日,在2023百度云智大会上,百度智能云发布了“AI原生应用Family”
2023-09-05 18:31:00
百度副总裁侯震宇:AI技术突破口在于前沿理论研究,探寻突破Transformer方法
...副总裁侯震宇出品|搜狐科技作者|郑松毅5月9日,百度文心一言技术交流会在北京百度科技园举办,百度集团副总裁侯震宇、百度智能云AI与大数据平台总经理忻舟在会上介绍,百度将坚持贯
2023-05-10 03:00:00
文心大模型4.0 Turbo来了!百度推出文心快码2.5,已覆盖内部80%程序员
...天,百度在WAVE SUMMIT深度学习开发者大会2024上,正式发布文心大模型4.0 Turbo版本,其同步上线网页端和API接口
2024-07-01 09:21:00
李彦宏:大模型已基本解决幻觉问题 发布两大“超级有用”AI技术
...检索增强的文生图技术(iRAG)和无代码工具“秒哒”。文心iRAG用于解决大模型在图片生成上的幻觉问题,极大提升实用性;无代码技术“秒哒”让每个人都拥有程序员的能力,将打造数
2024-11-13 14:10:00
百度文心一言发布会详细纪要
...百度在过去的十几年当中,一直在AI的研发上坚持投入。文心大模型第一个版本2019年就发布了,此后每年都要发布一个新版本。所以从这个意义上说,文心一言的发布只是我们过去多年努力
2023-03-17 12:00:00
跟文心一言讨论庄周梦蝶,它让我拥抱美好世界
...产品万众瞩目。2023年2月,百度正式宣布生成式AI产品“文心一言”即将到来,这也是全球第一家官宣类ChatGPT产品的大厂
2023-03-17 09:00:00
更多关于科技的资讯:
■方妮摘要:从劳动经济学视角优化战略性人力资源管理,是HR从后台职能部门向价值创造核心引擎转变的重要标志。通过对劳动经济学内涵
2026-01-09 05:02:00
随着消费者对室内空气质量的重视程度不断提升,空气净化器已成为新房装修后的必备家电之一。据中国家用电器协会发布的《2025中国洁净空气设备行业白皮书》显示
2026-01-08 23:38:00
韶音在CES 2026展示智能可穿戴生态布局:从开放式耳机到AI眼镜
在近日举行的CES 2026消费电子展上,全球开放式音频技术引领者Shokz韶音,不仅发布了开放式滤噪耳机OpenFit Pro
2026-01-08 23:40:00
中国蓝新闻讯 前不久,浙江省公布首批96家“科技新小龙”企业名单,涵盖新一代信息技术、生物医药、新材料等前沿领域。这些企业虽年轻
2026-01-08 20:27:00
中国蓝观察丨杭州也要造火箭!看商业航天在浙江开启新篇
中国蓝新闻讯 今天(1月7日),北京箭元科技有限责任公司(以下简称“箭元科技”)中大型液体运载火箭生产试验及总装总测基地正式落地浙江
2026-01-08 20:57:00
多彩贵州网讯鼠标轻点,数十公里外企业的用电异常数据实时呈现,以往需耗时多日现场排查的风险隐患,如今在几分钟内便可被系统自动识别与锁定
2026-01-08 21:59:00
江南时报讯 近年来,丹阳农商银行以“变中求进、守正创新”为主线,加快推进数字化转型,有力促进了数字金融协同发展,为普惠金融服务注入新动力
2026-01-08 22:32:00
合肥“机器人大学”新增“家庭课”:VR手把手教学,三个月“毕业”上岗
大皖新闻讯 家里乱了,谁来整理?这些日常家务,未来可能交给机器人。近日,合肥市具身智能机器人数据采集训练场在原有场景基础上
2026-01-08 18:05:00
三国何以“常青”?灵犀互娱发起游戏行业首个三国文化论坛
1月5日,中国游戏行业首个聚焦三国题材的文化论坛——“常青三国:重构、创新与全球化”在广州举行。论坛由南方周末报社与阿里巴巴灵犀互娱联合主办
2026-01-08 17:01:00
都匀佳速健诊所招新媒体运营 五险一金+弹性工作制
多彩贵州网讯(记者雷小露 裘金鉴) 为进一步扩大品牌影响力,推动科技医疗技术的广泛传播,都匀市佳速健健康管理有限公司(都匀佳速健诊所)现面向社会公开招聘新媒体运营专员1名
2026-01-08 17:05:00
【宅男财经|专家面对面】中新经纬1月7日报道称,蔚来创始人、董事长李斌表示,汽车行业和AI行业都在抢铜、银等原材料,原材料涨价还没有传导到终端售价
2026-01-08 14:13:00
中新经纬1月8日电 (谢婧雯)8日,“全球大模型第一股”智谱在港交所主板挂牌上市,发行价为每股116.20港元。智谱开盘价报120港元/股
2026-01-08 14:13:00
记者昨日从中国科学院获悉,“面向空间应用的锂离子电池电化学光学原位研究”项目已在中国空间站内开展,神舟二十一号航天员乘组共同在轨操作该项目实验
2026-01-08 15:08:00
上海晶珩ED-HMI3120:树莓派让工业控制可视化更简单
HMI3120工业人机界面是上海晶珩(EDATEC)最新推出的产品系列,内置树莓派CM5计算平台,融合了高性能处理能力
2026-01-08 15:23:00
26年深耕·千万青年共创:学院奖,链接青年力量与商业未来
当茅台王子酒的“王子音乐节”在高校掀起青春热潮,当可比克实践赛涌现出上千份青年创意实战方案,当江中健胃消食片通过校园共创唤醒品牌年轻记忆——中国大学生广告艺术节学院奖早已超越单纯的赛事维度
2026-01-08 15:25:00