• 我的订阅
  • 科技

百度文心大模型4.0技术进展

类别:科技 发布时间:2023-10-18 04:20:00 来源:浅语科技

10月17日,以“生成未来”为主题的百度世界2023在北京首钢园举办,百度首席技术官王海峰解读文心大模型4.0背后的关键技术和最新进展。王海峰表示,文心大模型4.0的理解、生成、逻辑、记忆四大能力都有显著提升,9月已开始小流量上线,过去一个多月效果又提升了近30%。8月31日文心一言面向全社会开放至今,用户规模已经达到4500万,开发者5.4万,场景4300个,应用825个,插件超过500个。

百度文心大模型4.0技术进展

文心大模型4.0首发,理解、生成、逻辑和记忆能力显著提升

据了解,百度在3月16日发布知识增强大语言模型文心一言。文心一言从数万亿数据和数千亿知识中融合学习,得到预训练大模型,在此基础上采用有监督精调、人类反馈强化学习、提示等技术,具备知识增强、检索增强和对话增强的技术优势。

文心一言的基础模型5月升级至文心大模型3.5,在基础模型升级、精调技术创新、知识点增强、逻辑推理增强、插件机制等方面创新突破,取得效果和效率的提升。

今天发布的文心大模型4.0,相比3.5版本,理解、生成、逻辑、记忆四大能力都有显著提升。其中理解和生成能力的提升幅度相近,而逻辑和记忆能力的提升则更大,逻辑的提升幅度达到理解的近3倍,记忆的提升幅度也达到了理解的2倍多。百度基于文心大模型研制了智能代码助手Comate,从内部应用效果来看,整体的代码采纳率达到40%,高频用户的代码采纳率达到60%。

百度文心大模型4.0技术进展

据悉,文心大模型4.0在9月已开始小流量上线,过去一个多月效果又提升了近30%。训练算法效率自3月以来已累计提升3.6倍,周均的训练有效率超过98%。文心大模型4.0基本技术架构与3.0和3.5版本一脉相承,并在多个关键技术方向上进一步创新突破。

在万卡算力上运行飞桨平台,通过集群基础设施和调度系统、飞桨框架的软硬协同优化,支持了大模型的稳定高效训练。建设了多维数据体系,形成了数据挖掘、分析、合成、标注、评估闭环,充分释放数据价值,大幅提升模型效果。基于有监督精调、偏好学习、强化学习等技术进行多阶段对齐,保证模型更好地与人类的判断和选择对齐。可再生训练技术通过增量式的参数调优,有效节省了训练资源和时间,加快了模型迭代速度。

此外,文心大模型4.0在输入和输出阶段都进行知识点增强。一方面,对用户输入的问题进行理解,并拆解出回答问题所需的知识点,然后在搜索引擎、知识图谱、数据库中查找准确知识,最后把这些找到的知识组装进Prompt送入大模型,准确率好,效率也高;另一方面,对大模型的输出进行反思,从生成结果中拆解出知识点,然后再利用搜索引擎、知识图谱、数据库,以及大模型本身进行确认,进而对有差错的点进行修正。

在强大的基础大模型的基础上,百度进一步研制了智能体机制,包括理解、规划、反思和进化,能够做到可靠执行、自我进化,并一定程度上将思考过程白盒化,让机器像人一样思考和行动,自主完成复杂任务,在环境中持续学习实现自主进化。

文心一言助力国图馆藏文化资源活化,升级国家跳水队AI辅助训练系统

百度已经与中国国家图书馆展开战略合作,发挥各自的资源、技术和服务优势,共同推动文化资源和知识服务智能化,普惠大众。国家图书馆拥有全球最大的古代方志,利用文心大模型学习古代方志与家谱数据,帮助全球华人获取更多寻根线索。王海峰现场分享了海外华人赵佩娟延续祖父乡愁,成功“寻根”的故事。

中国国家跳水队教练、奥运五金王陈若琳和奥运冠军全红婵、陈芋汐、王宗源也来到世界大会现场,与王海峰热切互动,解密梦之队训练“独门绝技”。基于文心一言等百度大模型技术,中国国家跳水队AI辅助训练系统全面升级,通过从海量数据和知识中学习,掌握了丰富的跳水知识,理解和执行教练员和运动员的复杂指令,及时提供准确信息,并对动作实时打分、精准量化分析,提供最有价值的指导信息,助力中国国家跳水队高效训练。

百度文心大模型4.0技术进展

现场,陈若琳受中国游泳协会主席周继红委托,授予百度为“中国国家跳水队人工智能合作伙伴”。陈若琳表示,中国国家跳水队与百度从2019年就开展了深入的技术合作,携手走过了东京奥运会、福冈世锦赛、杭州亚运会,目前正在备战明年巴黎奥运会。“感谢百度一直以来提供的技术支持与服务,未来双方将携手持续用人工智能技术帮助跳水队智能训练,通过科学训练提升竞技水平。”

百度人才培养星河计划发布,再培养500万大模型人才

王海峰现场公布了百度人工智能人才培养的最新数据,百度在2020年提出5年为全社会培养500万AI人才,截至目前,百度已经培养了420万AI人才。

百度文心大模型4.0技术进展

当下,大模型成为人工智能发展的热点方向,进一步加速产业变革,AI人才培养也需与时俱进。王海峰发布了百度人才培养星河计划,他表示,“我们将与产学研各界密切合作,深化产教融合,为社会再培养500万大模型人才,让人工智能科技的‘创新之花’,结出更多‘产业之果’,服务国家战略,服务社会发展,服务人民福祉!”

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-10-18 09:45:02

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

百度文心一格总架构师肖欣延:历程坎坷但未来已至,大模型赋能智能内容生成|WISE2023颠覆AIGC产业发展峰会
...的技术,在激荡的环境中探寻前行的方向。大会上,百度文心一格总架构师肖欣延发表了题为《跨模态大模型赋能智能内容生成》的主题演讲。在肖欣延看来,生成式人工智能时代已经到来,内容生
2023-05-26 15:52:00
抢占大模型红利,28家企业成为文心千帆大模型平台生态伙伴
抢占大模型红利,28家企业成为文心千帆大模型平台生态伙伴 5月18日,百度智能云在广州举行2023百度智能云合作伙伴大会,向在场的300家政企客户展示文心大模型在场景应用、生态建
2023-05-19 16:18:00
李彦宏:大模型场景下开源是最贵的,多模态是通往AGI的必经之路
...百度在这些领域有着长期投入,并将及时更新技术进展。文心最新成绩单:用户数、API日均调用量均超2亿李彦宏首先公布了文心一言和文心大模型的最新进展。据悉,文心一言于去年3月16
2024-04-16 17:57:00
Q2财报亮眼,AI助力百度打开新篇章
...如,在搜索框的基础上,添加了有来有回的对话框。基于文心一言大模型能力,百度分别在C端、B端推出文心一言APP与文心千帆大模型平台。在对话框之中,有多个灵感模板与prompt,
2023-08-24 09:00:00
智氪 ︱ AI贡献业绩,百度三季报超预期
...润增速预测定在了个位数水平。在亮眼的财务数据背后,文心大模型生态的进展也是市场关注的焦点。在现阶段,作为国内第一梯队的AI企业,百度能够在大模型的基础能力、具体应用生态和商业
2023-11-21 21:52:00
百度文心一言发布会详细纪要
...百度在过去的十几年当中,一直在AI的研发上坚持投入。文心大模型第一个版本2019年就发布了,此后每年都要发布一个新版本。所以从这个意义上说,文心一言的发布只是我们过去多年努力
2023-03-17 12:00:00
超6亿!文心大模型日调用量半年增长10倍,AI成百度最强加速引擎
...命性影响越来越显著。得益于全栈AI技术优势,以及基于文心大模型构建的AI应用快速普及,我们正在扩大AI落地规模,以解决现实世界中的问题,为外部客户和内部产品创造巨大价值。更值
2024-08-24 09:36:00
文心一言开放 大模型开抢C端市场
...型从业者松了一口气。让科技圈人士大半夜沸腾的是百度文心一言正式面向公众开放的消息,紧接着百川智能宣布通过备案,开放公众服务。此外抖音、智谱AI、中科院、商汤、MiniMax、
2023-09-01 00:07:00
独家|百度文心大模型4.0正加紧训练 或将在世界大会发布 【独家|百度文心大模型4.0正加紧训练 或将在世界大会发布】《科创板日报》8日讯,记者获悉,百度正在加紧训练文心大模型4
2023-10-08 17:48:00
更多关于科技的资讯:
PureblueAI清蓝完成数千万元天使轮融资,发布首款AI口碑营销数字员工
近日,国内AI营销技术服务公司PureblueAI清蓝正式宣布完成数千万元人民币天使轮融资。本轮融资由祥峰中国(Vertex China)领投
2026-03-04 14:03:00
舒尔推出SLX-D+无线系统:专业人士信赖之选,面向广大用户精心打造
扩展功能全面升级,为这款备受信赖的无线产品系列注入了全国范围的部署实力、便捷的远程管理能力,以及高效的反馈抑制技术舒尔公司全新推出了SLX-D+无线系统
2026-03-04 14:04:00
鲁网3月4日讯(记者 杜方奇)近日,记者走进山东省枣庄市池明生物科技有限公司(以下简称“池明生物”),实地感受这家本土日化标杆企业的发展现状——智能化生产车间内
2026-03-04 12:19:00
全国政协委员陈仙辉:建议以超导技术破解AI数据中心能耗难题
大皖新闻讯 “人工智能数据中心正朝着百兆瓦、吉瓦量级迈进,传统技术路线已难以为继,高温超导技术是破局能耗问题的关键方向
2026-03-04 13:36:00
全国政协委员陆铭:千问春节下单近2亿次,证明“AI+消费”巨大潜力
全国两会召开之际,如何进一步释放内需潜力成为各界关注焦点。全国政协委员、著名经济学家陆铭在接受记者采访时表示,春节期间用户在千问上“一句话下单”近2亿次
2026-03-04 11:40:00
山东移动滨州分公司:科技赋韵千年曲会 匠心护航文化传承
鲁网3月4日讯弦鼓传古韵,5G 润乡音。2026 年 2 月 28 日,胡集书会在滨州惠民正式启幕。滨州移动以“科技赋能
2026-03-04 11:07:00
鲁网3月4日讯在AI创业浪潮下,市南区聚焦OPC单人AI创业服务,打造高效、暖心的OPC注册环境,激发个体AI创业活力
2026-03-04 10:31:00
中国网3月4日讯 据国家安全部微信公众号消息,“【电子发票】张某某先生,您的发票已开好,请点击下载”——当收件箱弹出这类带着你真实姓名的电子邮件
2026-03-04 07:58:00
玉磊 柳州工学院一、人工智能在财务报表分析中的应用现状人工智能技术在财务报表分析中的首次应用,源于自然语言处理(NLP)和机器学习(ML)的发展
2026-03-04 07:08:00
金皓摘要:异常检测作为数据分析和智能系统中的重要研究方向,广泛应用于金融风控、工业监测、网络安全和医疗诊断等领域。传统统计方法和近年来快速发展的深度学习方法
2026-03-04 07:08:00
烟台联通圆满完成2026“百花汇海”山东秧歌会通信保障
胶东在线3月3日讯3月1日,由山东省文学艺术界联合会等单位指导主办的2026“百花汇海”山东秧歌会在烟台海阳市河清岛体育场盛大举行
2026-03-03 20:29:00
涌金楼丨浙江经济第一区确立“首要任务”
余杭“十四五”五年成绩单。受访者供图3月2日,余杭区召开经济高质量发展大会。这是余杭连续第五年以“高质量发展”为题召开大会
2026-03-03 22:27:00
江南时报讯 凌晨2点,扬子江数字视听产业园的“短剧公寓”里,张弛仍然坐在电脑前,屏幕上是他十多个海外短视频账号的数据反馈——当天发布的97条短剧切片
2026-03-03 22:48:00
河北特色产业集群数字金融平台助力解决企业融资难银企互联 点“数”成金“通过平台提供的‘数字信用’,仅用5天我们就拿到了1700万元的授信贷款
2026-03-03 17:55:00