• 我的订阅
  • 科技

腾讯混元参战大模型:“幻觉率”可降低30%,多个指标超越GPT3.5

类别:科技 发布时间:2023-09-08 11:20:00 来源:澎湃新闻

腾讯混元大模型logo。

“百模大战”新增又一巨头:腾讯官宣参战。

9月7日,在2023腾讯全球数字生态大会上,腾讯正式发布混元大模型,并宣布通过腾讯云对外开放。

资料显示,腾讯混元大模型是腾讯自研的一款通用大模型,目前已经接入腾讯50多个业务测试,包括腾讯云、腾讯广告、腾讯游戏、腾讯金融科技、腾讯会议、腾讯文档、微信搜一搜、QQ浏览器等业务和产品。

值得注意的是,这并非是腾讯首次公开大模型相关进展。此前6月19日,腾讯曾发布依托腾讯云TI平台打造行业大模型精选商店,提供MaaS(Model-as-a-Service)一站式服务,构建专属大模型及智能应用。

“大模型竞争还在马拉松的第一公里,这个行业太新了,不存在清晰的市场份额或占比。”9月7日,在接受澎湃新闻等媒体采访时,腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生坦言,“大家动不动就喜欢发布通用大模型,在我看来这条路有点走偏了,不能解决产业实际问题和痛点。”

对于大模型落地前景,他也直言:“有些前沿投入和布局,可能要3到5年才能看到商业回报,现在谈大模型的商业前景还为时过早。”

腾讯的大模型“路线图”

今年上半年,多家大厂扎堆发布大模型,“百模大战”一度成为舆论焦点,而腾讯一直到9月份才发布通用大模型,似乎显得有些姗姗来迟。

“腾讯做大模型只看自己,不看别人。”9月7日,对于发布时间,腾讯副总裁蒋杰向澎湃新闻记者坦言,“混元大模型在腾讯内部已经内测很久,在推出时间上,没有考虑过和同行进行赛跑。”

从基本参数来看,目前腾讯混元的参数规模超千亿,预训练语料超2万亿tokens,具备中文创作能力,复杂语境下的逻辑推理能力,以及任务执行能力。

和其他模型相比,混元大模型的特点和优势是什么?澎湃新闻记者梳理发现,其最大特点是在解决“幻觉”能力上表现较为突出。所谓的“幻觉”,指的是大模型在回答提问时会出现答非所问、胡说八道的现象,腾讯混元大模型在预训练阶段通过“探真”算法进行事实修正,实测幻觉率可以降低30%-50%。

“其他厂商往往会通过知识图谱或是搜索外挂来让大模型的检索能力变得更加准确,但使用外挂会导致新的幻觉出现,因此腾讯决定在大模型预训练阶段就解决这个问题。”蒋杰表示。

腾讯混元参战大模型:“幻觉率”可降低30%,多个指标超越GPT3.5

此外,混元大模型还具备超长文本的处理能力,能够提供超过4000字的长文回答,而在同样的命题下GPT-3.5只能提供超过1000字的问答。在数据源头方面,蒋杰介绍,腾讯做小模型、大模型甚至大语言模型,都不会使用个人隐私数据。此外,腾讯的内容产品,也为腾讯混元大模型提供了大规模、多样化的语料库,能够学习到各类应用场景中的语言知识和语境理解能力。

在具体指标上,混元大模型在多个指标上超越了GPT-3.5,包括代码子项、STEM子项、高考题子项和数学子项上,但和GPT-4还有距离。蒋杰表示,国内的厂商在做大语言模型的时候,需要循序渐进,脚踏实地做好每一项技术突破,并且坦诚面对和国际厂商在技术上的一些差距。

外界好奇的是,为何腾讯在推出行业大模型后再次推出通用大模型?

此前汤道生曾提到,通用大模型可以在100个场景中,解决70%-80%的问题,但未必能100%满足企业某个场景的需求。相比盲目使用通用大模型,企业基于行业大模型构建自己的专属模型,也许是更优的选项。模型参数比通用大模型少,训练和推理的成本更低,优化也更容易。

对此,汤道生告诉澎湃新闻记者,推出时间较晚是因为腾讯一直在研发和应用的过程中。其实腾讯内部早已开始内测混元大模型,但在没有经历充分的应用融合和实践前不会对外公布其具体进展,最终公布的成品,是经过充分打磨后的,但依然会不断更新和迭代。

大模型商业化究竟路在何方?

在“百模大战”的热度略有减退后,大模型的实际落地效能成为外界考量的重点。

谈到混元大模型未来商业前景时,蒋杰坦言,在To B(企业)端产生商业收入还有待探索,因为目前混元大模型在面对成熟度和复杂任务的处理能力还不够全面,因此对于较多专业场景不能充分解锁,应用有待完善。

“混元大模型一开始就不是为了发布而发布,而是根据腾讯自身应用,例如微信、QQ等进行相关研发和匹配,提供互相深度融合的能力,才能抵消大模型背后的高昂设备、训练和人力成本。”蒋杰表示。

此前,百度智能云副总裁朱也在接受澎湃新闻记者在内的媒体采访时曾表示:“从衡量大模型本身的商业价值角度看,如果应用不起来,整个大模型很难持续下去,确实是需要投入,整个生态起来、应用繁荣很重要。我们判断,偏向于营销服务、办公提效这两个场景,可能会首先实现大规模落地,我认为接下来几个月能够看到应用逐渐落地,规模逐渐增大。”

对于大模型研发的高额成本,汤道生透露,腾讯内部对于资源分配有倾斜性,混元大模型是腾讯内部最重要的项目之一,因此会以第一优先级进行考虑,目前公司内部的人员配置和资源合作“跑得很顺利”,但大模型的竞争尚在马拉松的第一公里,可能要到3到5年后才能看到相应回报。

就在不久前,百度宣布“文心一言”向全社会全面开放,还将开放一批经过全新重构的AI原生应用,让广大用户充分体验生成式AI的理解、生成、逻辑、记忆四大核心能力。

混元大模型是否也将对外开放?对此,蒋杰表示,是否提供C端(消费者端)服务仅仅是时间和选择的问题,“目前我们还是侧重在内部应用场景中做尝试,TO C与否只是一种‘开关’,做好自身能力、提高准确性才是我们最为关注的。”

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-09-08 15:45:02

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

搜狐科技实测腾讯混元大模型:能模仿鲁迅、林黛玉,还会玩梗换算“花西子币”
比百度晚了半年、比阿里晚了5个月,腾讯混元大模型虽迟但到。此前称“不急于把半成品拿出来展示”,但发布后腾讯也坦言,目前只是“可用、可实践”。值得一提的是,9月1日,国内一批生成式
2023-09-15 13:35:00
腾讯混元大模型批量上新:10秒生成AI图像,超过180个腾讯业务接入 | 最前线
揭开大模型“混元”的面纱两个月后,10月26日,腾讯混元迎来第一次“批量上新”,并且对外开放。首先,通过测试申请的用户,都能够在“混元”上画画了——从生成图像的准确度、美观度而言
2023-10-29 10:13:00
腾讯汤道生:打破AI“落地玻璃”,让可见变为可用
本文转自:新华网腾讯集团高级执行副总裁、云与智慧产业事业群CEO 汤道生5月17日,“腾讯云生成式AI产业应用峰会”在北京举办,大会披露了腾讯混元大模型、行业大模型的最新能力升级
2024-05-18 10:29:00
大模型应用疯狂加速,洗牌却在静悄悄进行了
...公布了文心一言大模型开源。与此同时,“姗姗来迟”的腾讯混元大模型,一亮相便“秀”起了“肌肉”,科大讯飞与华为合作发布“星火一体机”,进一步把大模型端侧应用摆在了台面上。一波接
2023-10-07 15:24:00
腾讯自研混元大模型亮相,将通过腾讯云对外开放
...入长跑期,从参数至上转向实用优先。在今天举行的2023腾讯全球数字生态大会上,腾讯混元大模型亮相,并宣布通过腾讯云对外开放。据悉,腾讯混元大模型是由腾讯全链路自研的通用大语言
2023-09-07 13:57:00
最强国产多模态刚刚易主!腾讯混元把GPT-4/Claude-3.5都超了
...中文多模态大模型测评基准SuperCLUE-V,新鲜出炉:特别是腾讯的hunyuan-vision、上海AI Lab的InternVL2-40B
2024-08-09 09:38:00
混元已接入腾讯50多个业务,国产大模型将加速转入长跑期?
...优先,国产大模型正在进入长跑期。今日(9月7日),2023腾讯全球数字生态大会在深圳宝安举行。在大会上,腾讯集团高级执行副总裁、腾讯云与智慧产业事业群CEO汤道生宣布,腾讯自
2023-09-07 18:01:00
腾讯推出新一代大模型“混元Turbo”,性能大幅提升,定价低50%
9月5日,腾讯宣布推出新一代大模型“混元Turbo”,相比前代模型,腾讯混元Turbo性能有显著提升,训练效率提升108%
2024-09-05 17:29:00
腾讯推出新一代大模型「混元Turbo」,性能大幅提升,定价低50%
鞭牛士 9月5日消息,腾讯宣布推出新一代大模型“混元Turbo”。腾讯介绍,该模型采用MoE架构,比上一代产品推理效率提升100%,推理成本降低50%,解码速度提升20%。腾讯公
2024-09-05 14:28:00
更多关于科技的资讯:
江南时报讯 近日,苏州农商银行与人保财险苏州市分公司深化协同,成功落地全国首单银保合作“科创贷”。该企业作为国家级高新技术企业
2026-02-10 21:42:00
西秀食品“双星”冲刺首季“开门红”
连日来,位于西秀区的贵州安顺云鹫食品有限公司和贵州好味达食品有限公司呈现一派热火朝天的生产景象。作为本土食品行业的标杆企业
2026-02-10 22:10:00
锦江国际集团启动马年春节多元促消费活动,激发假日市场新活力
马年春节临近,锦江国际集团依托“吃、住、行、游”全产业链优势,为海内外宾客准备了丰富的年娱、年味项目,陪伴大家一起过个精彩中国年
2026-02-10 17:24:00
潮新闻讯 目光所及,即是世界。此刻,我们站在迈向高水平科技自立自强的时代关口。“科技创新和产业创新深度融合”“概念验证”“中试平台”“职务科技成果赋权”“资产单列管理”“技术经理人”等成为了中国科技成果转化行业的热词
2026-02-10 18:06:00
中国消费者报北京讯(记者吴博峰)记者近日从江苏省储能行业协会获悉,即将于今年5月举办的CESC2026第四届储能大会主论坛将汇聚行业各方人士
2026-02-10 18:33:00
中国消费者报报道(记者何永鹏)近日,由市场监管总局发展研究中心、中国社会科学院财经战略研究院课题组联合完成的《2025直播电商行业发展白皮书》(以下简称《白皮书》)正式发布
2026-02-10 19:03:00
2025年池州市累计完成以旧换新交易11.24万笔 带动社会消费22.6亿元
大皖新闻讯 记者从2月9日召开的池州市提质增效实施消费品以旧换新政策新闻发布会上获悉,2025年,池州市累计完成消费品以旧换新交易11
2026-02-10 18:14:00
记者今天(2月10日)了解到,市场监管总局(国家标准委)批准发布一批重要国家标准。在新兴领域方面,发布脑机接口、数字孪生等5项国家标准
2026-02-10 14:15:00
滨州移动科技赋能年货盛会 铸就网络保障新典范
鲁网2月10日讯2026年2月6日至8日,“购在中国·2026滨州迎新春消费季暨乐购滨州年货大集”在滨州市全民健康文化中心体育场南广场盛大举办
2026-02-10 15:09:00
西北工业大学科研团队在脑机接口关键领域取得新突破
想象一下,当瘫痪者用意念操控机械臂,稳稳端起水杯;当失语者的思维被直接“翻译”成流畅语音;当帕金森患者的颤抖经神经调控逐渐平息……这些曾出现在科幻电影里的场景
2026-02-10 16:06:00
创新潮涌!温州乐清科技创新指数连续八年领跑全省
日前,位于温州乐清北白象镇中方智能园区的温州合力自动化仪表有限公司,成功研发出AI智能物联直行程电动执行器。作为流体控制领域的领军企业
2026-02-10 16:20:00
诺特兰德公益创新获认可,一举摘得公益节三项荣誉
鲁网2月10日讯1月22日至23日,第十五届公益节暨2025ESG影响力年会在北京举行。全球膳食营养品牌诺特兰德凭借其在公益领域的持续深耕与创新实践
2026-02-10 16:22:00
中国消费者报重庆讯(记者刘文新)2月6日,重庆举行低空经济重大成果发布会,发布《重庆市低空装备产业链产品名录》(2025版)
2026-02-10 16:03:00
中交一航局二公司检测中心研发一款基于若依结构的档案管理系统
鲁网2月10日讯近日,中交一航局二公司检测中心研发一款基于若依结构的档案管理系统,该系统依托若依架构精准破解行业痛点,集成RBAC权限管控
2026-02-10 15:09:00
量子技术赋能电网 安徽筑牢民生用电安全线
大皖新闻讯 今年1月,国内首个量子智慧台区在马鞍山市当涂县乌溪镇七房村正式投运。这是我国首次将量子技术与柔性互联技术规模化应用于乡村电网
2026-02-10 11:19:00