• 我的订阅
  • 科技

百度CTO王海峰:文心大模型的底色和成色

类别:科技 发布时间:2023-10-19 05:50:00 来源:每日看点快看

本文转自:中国科学报

百度CTO王海峰:文心大模型的底色和成色

王海峰 百度供图

■本报记者 赵广立

10月17日,“百度世界2023”在北京举行。

百度公司董事长兼首席执行官(CEO)李彦宏用一个多小时发布了“基础模型全面升级”的文心大模型4.0,展示其在理解、生成、逻辑和记忆等能力上的显著提升,并介绍了新搜索、新地图等10余款被大模型重构的业务应用。他对此次升级大加称赞,称其综合能力“与GPT-4相比毫不逊色”,并断言“大模型将开启一个繁荣的人工智能(AI)原生应用生态”。

文心大模型从3.5升级到4.0,仅用4个多月。这期间,文心大模型是怎样变强的?

在紧凑的发布环节,百度首席技术官(CTO)王海峰仅用20分钟就解读了文心大模型4.0背后的“助推剂”。一开场,他就用一句话解答了大家的疑惑:“团队基于更大的算力、更多的数据和更强的算法,训练出来规模更大、效果更好的文心大模型4.0。”

升级:算力更大、数据更多、算法更强

王海峰坦言,文心大模型4.0的基本技术架构与文心大模型3.0和3.5版本一脉相承,升级是基于在多个关键技术方向上进一步的创新突破。

首先是训练环境更优了。文心大模型的基础模型训练离不开飞桨深度学习平台。王海峰透露,百度技术团队将飞桨平台运行在万卡算力上,并通过集群基础设施和调度系统、飞桨框架的软硬协同优化,支持文心大模型的稳定高效训练。

其次是数据质量更好了。没有好的数据做“养料”,大模型难为无米之炊。王海峰说,技术团队建设了多维数据体系,形成了从数据挖掘、分析、合成到标注和评估的闭环,以充分释放数据价值,大幅提升模型效果。

然后是训练算法更强了。百度技术团队通过打磨训练算法,“保证模型更好地与人类的判断和选择对齐”。在既往技术创新的基础上,技术团队基于有监督精调、偏好学习、强化学习等技术进行多阶段对齐,保证模型更符合人类价值观。同时,技术团队还使用可再生训练技术,通过增量式的参数调优,进一步节省训练资源和时间,加快模型迭代速度。

价值对齐,多多益善。为提升大模型的准确性,文心大模型4.0在输入、输出两个阶段都运用了知识点增强,具体做法为在输入端对用户输入的问题进行理解,并拆解所需的知识点,然后在搜索引擎、知识图谱、数据库中获取准确知识,最后把得到的知识组装进prompt送入大模型;输出端会对大模型的输出进行“反思”,从生成结果中拆解出知识点,然后利用搜索引擎、知识图谱、数据库及大模型本身进行确认,修正偏差。

王海峰介绍,借鉴《思考,快与慢》一书阐述的智能系统,百度研制了智能体机制。在基础大模型的基础上,百度又进一步研制了反应慢但更理性、更准确的“系统2”,让大模型像人一样理解、规划、反思,一定程度上将思考过程白盒化,在完成复杂任务的同时,还可以在环境中持续学习、自主进化。

成色几何?用户“用脚”投票

8月31日,知识增强大语言模型“文心一言”面向全社会开放。仅40多天时间,文心一言的用户规模就已达到4500万,开发者5.4万,场景4300个,实现应用825个、“插件”超过500个。

插件是一种特殊的AI原生应用,其门槛最低,也最容易上手,能让开发者、创业者快速加入到生态中。个人及企业的数据、能力或应用,都能快速变成AI插件,增强大模型的能力,让大模型更实用易用。比如,大模型接入权威法律数据的“智能法律助手”能为用户提供法律咨询的相关建议,简历助手插件则能帮用户一键生成简历模板。

一个月前,百度上线了“灵境”插件平台,目前已有2.7万开发者申请入驻,覆盖法律、职场、学习等多个领域。

“可以看到,用户使用文心一言的场景非常广泛,从欢迎词、演讲稿到企划书、说明书,再到流程图、思维导图等,涵盖了工作和生活的方方面面。”王海峰说。

使用文心一言的不仅有企业、个人用户,还有国家队。

在百度世界2023现场,中国游泳协会授予百度“中国国家跳水队人工智能合作伙伴”称号,感谢百度基于文心一言对跳水队员在训练中的“技术指导”。中国国家跳水队教练、奥运“五金王”陈若琳,奥运冠军全红婵、陈芋汐、王宗源来到大会现场,分享了文心一言等百度大模型技术在智能训练上的作用。例如,升级后的中国国家跳水队AI辅助训练系统可以实时打分、拆解动作、分析过往成绩数据等,以开发个性化、专业化的训练方案。

王海峰解读,今年,百度基于文心一言等AI技术对中国国家跳水队AI辅助训练系统进行了全面升级,通过从海量数据和知识中学习,掌握了丰富的跳水知识,不仅能理解和执行教练与运动员的复杂指令,及时提供准确信息,还可以对动作实时打分、精准量化分析,提供有价值的指导信息,帮助运动员精雕每招每式。

中国国家跳水队与百度的渊源由来已久。陈若琳在现场表示,双方从2019年就开展深入的技术合作,携手走过了东京奥运会、福冈世锦赛、杭州亚运会等多个大赛赛程,目前正在备战明年的巴黎奥运会。

在列举文心大模型的应用场景时,不能忽略一个特殊的应用场景——华人寻根。

许多华人在寻根之旅中受限于只言片语的家族记载和晦涩难懂的地方志,寻根梦难圆。通过与国家图书馆合作,百度文心大模型大量学习古代方志和家谱数据,并进行文字识别和理解,同时综合应用地点、职业、饮食、重要事迹等信息的知识图谱,在文心一言上线了“古文今问”服务。用户只需输入寻根信息,就能得到相应的线索反馈。在国家图书馆地方志和文心大模型的帮助下,许多人可以找到自己的“根”。

据了解,文心一言“古文今问”服务首批已上线福建福州、厦门、泉州、漳州等区域的数据,未来仍将持续更新。王海峰表示,文心一言助力国家图书馆馆藏文化资源活化,有望让更多人受益于知识和科技的力量。

“星河计划”:再培养500万大模型人才

AI技术加速进步,在千行百业的应用越来越深入。在这个过程中,AI人才不可或缺。王海峰说,2020年,百度提出“5年为全社会培养500万人工智能人才”的目标,截至目前,培养的人才数量已完成目标的84%。

他说,当下大模型成为AI发展的热点方向,会进一步加速产业变革,AI人才培养也需与时俱进。现场,王海峰发布了百度人才培养新举措——“星河计划”。

“我们将与产学研各界密切合作,深化产教融合,为社会再培养500万大模型人才。”王海峰表示,之所以这么做,是为了让AI科技的“创新之花”结出更多“产业之果”,服务国家战略、服务社会发展、服务人民福祉。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-10-19 08:45:02

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

...十届中国计算机大会现场精彩不断——最新成果!百度CTO王海峰揭秘文心大模型4.0本报讯(沈阳日报、沈报全媒体高级记者刘洋)10月26日-28日
2023-10-29 04:43:00
【百度CTO王海峰:文心大模型3.5新增插件机制 使其具备生成实时准确信息的能力】《科创板日报》27日讯,百度首席技术官王海峰表示,文心大模型3.5最大的一个变化是新增了插件机制
2023-06-27 12:33:00
【百度首席技术官王海峰:飞桨已拥有750万名开发者 文心一言将逐步开放插件生态】《科创板日报》6日讯,2023世界人工智能大会上,百度首席技术官、深度学习技术及应用国家工程研究中
2023-07-06 18:31:00
百度文心大模型 3.5 已支持插件,将逐步向开发者开放
据中国科学报报道,百度首席技术官王海峰表示,文心大模型3.5最大的一个变化是新增了插件机制,默认的内置插件“百度搜索”,使得文心一言具备生成实时准确信息的能力;长文本摘要和问答插
2023-06-27 22:18:00
百度王海峰披露飞桨生态最新成果 开发者数量已达800万
...首席技术官、深度学习技术及应用国家工程研究中心主任王海峰首次对外表示,大语言模型具备了理解、生成、逻辑、记忆等人工智能的核心基础能力,为通用人工智能带来曙光。飞桨开发者数已达
2023-08-17 09:15:00
百度文心大模型4.0技术进展
...主题的百度世界2023在北京首钢园举办,百度首席技术官王海峰解读文心大模型4.0背后的关键技术和最新进展。王海峰表示,文心大模型4.0的理解、生成、逻辑、记忆四大能力都有显著
2023-10-18 04:20:00
百度发布文心大模型4.0、飞桨框架3.0等技术
...首席技术官、深度学习技术及应用国家工程研究中心主任王海峰表示,截至目前,飞桨文心生态已凝聚1465万开发者,服务37万家企事业单位,创建95万个模型。王海峰今日发布了飞桨新一
2024-06-29 10:02:00
文心大模型4.0 Turbo来了!百度推出文心快码2.5,已覆盖内部80%程序员
...首席技术官、深度学习技术及应用国家工程研究中心主任王海峰介绍,文心一言目前用户规模已突破3亿,每日调用量超过5亿;飞桨平台已累计服务1465万开发者、37万企业,构建了超95
2024-07-01 09:21:00
百度CTO王海峰:百度“智能代码助手”整体采纳率已达到46%
...关村论坛年会未来人工智能先锋论坛上,百度首席技术官王海峰表示,从万亿级训练数据中,文心大模型既学到了自然语言的能力,也学到了代码能力。基于文心大模型的这两种能力,百度开发了智
2024-04-27 14:59:00
更多关于科技的资讯:
用AI技术为青少年心理“把脉”!这一项目成功入围2026年度河南省科技攻关项目
大河网讯 近日,河南省科学技术厅公示 2026年度河南省科技攻关拟立项项目,由科创联达(河南)科技有限公司与中原工学院联合申报的“多模态融合与大语言模型驱动的青少年心理健康智能监测研究”项目入选
2026-01-20 22:45:00
张宣科技:科技驱动打造绿色低碳新能源标杆
图为张宣科技技术骨干正在对水系统设备进行全面巡视检查。于飞摄河北新闻网讯(王杨、马薇)打造全球领先的绿氢绿能耦合冶金示范
2026-01-20 17:17:00
聚焦临沂两会」临沂市政协委员许金龙:以科技创新引领标志性产业链高质量发展
鲁网1月20日讯“抢抓人工智能战略风口,以科技创新为核心引擎赋能产业升级,推动我市标志性产业链向高端化、智能化、绿色化方向提质进阶
2026-01-20 17:23:00
中国消费者报北京讯(记者裴莹)1月19日,荣耀与泡泡玛特合作推出的“荣耀500 Pro MOLLY 20周年限定版”手机正式发布
2026-01-20 17:30:00
中国消费者报北京讯(记者孙蔚)近日,转转集团发布《2025二手消费年度洞察》(以下简称报告)。报告显示,05后成为二手消费新生力量
2026-01-20 17:30:00
中国消费者报北京讯(记者桑雪骐)1月19日,海信召开2026 RGB-Mini LED影游旗舰E8S新品发布会,正式推出影游旗舰E8S系列电视
2026-01-20 17:30:00
春节将至 在中国空间站怎么吃年夜饭?
中国消费者报报道(记者桑雪骐)航天员的手指轻轻按下一个特制设备的启动键,28分钟后,伴随着设备上的按键灯闪烁,取出的不是常见的复热食品袋
2026-01-20 18:00:00
大皖新闻讯 1月20日,记者从阜阳市商业局获悉,为全力推动“超级皖”美食争霸赛半决赛活动氛围,该市将发放60万元消费券
2026-01-20 18:14:00
宜兴市徐舍镇:厚植沃土育“小巨人”
近年来,徐舍镇持续优化营商环境,强化政策引导与服务保障,积极构建富有活力的产业生态,通过搭建产学研对接桥梁,推动技术、人才
2026-01-20 18:52:00
空降社渚!KFC&必胜客“双子星”来了,常州首家
社渚喜讯!常州首对餐饮“双子星”——肯德基与必胜客,即将同步落户社渚!二月初,开业倒计时正式启动,快乐进入双倍时代。从此小镇生活添了新滋味
2026-01-20 18:54:00
中新经纬1月20日电 19日,小红书正式上线《社区公约2.0》,在延续“真诚分享,友好互动”社区价值观的基础上,明确提出“反对制造对立”的倡导
2026-01-20 19:14:00
打造复合生活空间,应对多元业态挑战!石家庄本土超市加速向体验化、社区化转型
1月16日上午9时,刚刚开业的石家庄北国超市青园店客流如织。经历了永辉闭店、北国接手后,经过30天左右的装修筹备,该店如今以全新面貌亮相
2026-01-20 19:39:00
从技术突破到产业落地:见证国器传感的量子征程
在工业4.0浪潮席卷全球的今天,传感器作为智能制造的核心元件,其技术突破与产业升级已成为衡量国家工业竞争力的重要标尺。这场没有硝烟的科技博弈中
2026-01-20 19:53:00
第17期监制:杨春红制作:王金顺记者:牛思家
2026-01-20 16:59:00