• 我的订阅
  • 科技

腾讯混元参战大模型:“幻觉率”可降低30%,多个指标超越GPT3.5

类别:科技 发布时间:2023-09-08 11:20:00 来源:澎湃新闻

腾讯混元大模型logo。

“百模大战”新增又一巨头:腾讯官宣参战。

9月7日,在2023腾讯全球数字生态大会上,腾讯正式发布混元大模型,并宣布通过腾讯云对外开放。

资料显示,腾讯混元大模型是腾讯自研的一款通用大模型,目前已经接入腾讯50多个业务测试,包括腾讯云、腾讯广告、腾讯游戏、腾讯金融科技、腾讯会议、腾讯文档、微信搜一搜、QQ浏览器等业务和产品。

值得注意的是,这并非是腾讯首次公开大模型相关进展。此前6月19日,腾讯曾发布依托腾讯云TI平台打造行业大模型精选商店,提供MaaS(Model-as-a-Service)一站式服务,构建专属大模型及智能应用。

“大模型竞争还在马拉松的第一公里,这个行业太新了,不存在清晰的市场份额或占比。”9月7日,在接受澎湃新闻等媒体采访时,腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生坦言,“大家动不动就喜欢发布通用大模型,在我看来这条路有点走偏了,不能解决产业实际问题和痛点。”

对于大模型落地前景,他也直言:“有些前沿投入和布局,可能要3到5年才能看到商业回报,现在谈大模型的商业前景还为时过早。”

腾讯的大模型“路线图”

今年上半年,多家大厂扎堆发布大模型,“百模大战”一度成为舆论焦点,而腾讯一直到9月份才发布通用大模型,似乎显得有些姗姗来迟。

“腾讯做大模型只看自己,不看别人。”9月7日,对于发布时间,腾讯副总裁蒋杰向澎湃新闻记者坦言,“混元大模型在腾讯内部已经内测很久,在推出时间上,没有考虑过和同行进行赛跑。”

从基本参数来看,目前腾讯混元的参数规模超千亿,预训练语料超2万亿tokens,具备中文创作能力,复杂语境下的逻辑推理能力,以及任务执行能力。

和其他模型相比,混元大模型的特点和优势是什么?澎湃新闻记者梳理发现,其最大特点是在解决“幻觉”能力上表现较为突出。所谓的“幻觉”,指的是大模型在回答提问时会出现答非所问、胡说八道的现象,腾讯混元大模型在预训练阶段通过“探真”算法进行事实修正,实测幻觉率可以降低30%-50%。

“其他厂商往往会通过知识图谱或是搜索外挂来让大模型的检索能力变得更加准确,但使用外挂会导致新的幻觉出现,因此腾讯决定在大模型预训练阶段就解决这个问题。”蒋杰表示。

腾讯混元参战大模型:“幻觉率”可降低30%,多个指标超越GPT3.5

此外,混元大模型还具备超长文本的处理能力,能够提供超过4000字的长文回答,而在同样的命题下GPT-3.5只能提供超过1000字的问答。在数据源头方面,蒋杰介绍,腾讯做小模型、大模型甚至大语言模型,都不会使用个人隐私数据。此外,腾讯的内容产品,也为腾讯混元大模型提供了大规模、多样化的语料库,能够学习到各类应用场景中的语言知识和语境理解能力。

在具体指标上,混元大模型在多个指标上超越了GPT-3.5,包括代码子项、STEM子项、高考题子项和数学子项上,但和GPT-4还有距离。蒋杰表示,国内的厂商在做大语言模型的时候,需要循序渐进,脚踏实地做好每一项技术突破,并且坦诚面对和国际厂商在技术上的一些差距。

外界好奇的是,为何腾讯在推出行业大模型后再次推出通用大模型?

此前汤道生曾提到,通用大模型可以在100个场景中,解决70%-80%的问题,但未必能100%满足企业某个场景的需求。相比盲目使用通用大模型,企业基于行业大模型构建自己的专属模型,也许是更优的选项。模型参数比通用大模型少,训练和推理的成本更低,优化也更容易。

对此,汤道生告诉澎湃新闻记者,推出时间较晚是因为腾讯一直在研发和应用的过程中。其实腾讯内部早已开始内测混元大模型,但在没有经历充分的应用融合和实践前不会对外公布其具体进展,最终公布的成品,是经过充分打磨后的,但依然会不断更新和迭代。

大模型商业化究竟路在何方?

在“百模大战”的热度略有减退后,大模型的实际落地效能成为外界考量的重点。

谈到混元大模型未来商业前景时,蒋杰坦言,在To B(企业)端产生商业收入还有待探索,因为目前混元大模型在面对成熟度和复杂任务的处理能力还不够全面,因此对于较多专业场景不能充分解锁,应用有待完善。

“混元大模型一开始就不是为了发布而发布,而是根据腾讯自身应用,例如微信、QQ等进行相关研发和匹配,提供互相深度融合的能力,才能抵消大模型背后的高昂设备、训练和人力成本。”蒋杰表示。

此前,百度智能云副总裁朱也在接受澎湃新闻记者在内的媒体采访时曾表示:“从衡量大模型本身的商业价值角度看,如果应用不起来,整个大模型很难持续下去,确实是需要投入,整个生态起来、应用繁荣很重要。我们判断,偏向于营销服务、办公提效这两个场景,可能会首先实现大规模落地,我认为接下来几个月能够看到应用逐渐落地,规模逐渐增大。”

对于大模型研发的高额成本,汤道生透露,腾讯内部对于资源分配有倾斜性,混元大模型是腾讯内部最重要的项目之一,因此会以第一优先级进行考虑,目前公司内部的人员配置和资源合作“跑得很顺利”,但大模型的竞争尚在马拉松的第一公里,可能要到3到5年后才能看到相应回报。

就在不久前,百度宣布“文心一言”向全社会全面开放,还将开放一批经过全新重构的AI原生应用,让广大用户充分体验生成式AI的理解、生成、逻辑、记忆四大核心能力。

混元大模型是否也将对外开放?对此,蒋杰表示,是否提供C端(消费者端)服务仅仅是时间和选择的问题,“目前我们还是侧重在内部应用场景中做尝试,TO C与否只是一种‘开关’,做好自身能力、提高准确性才是我们最为关注的。”

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-09-08 15:45:02

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

搜狐科技实测腾讯混元大模型:能模仿鲁迅、林黛玉,还会玩梗换算“花西子币”
比百度晚了半年、比阿里晚了5个月,腾讯混元大模型虽迟但到。此前称“不急于把半成品拿出来展示”,但发布后腾讯也坦言,目前只是“可用、可实践”。值得一提的是,9月1日,国内一批生成式
2023-09-15 13:35:00
腾讯混元大模型批量上新:10秒生成AI图像,超过180个腾讯业务接入 | 最前线
揭开大模型“混元”的面纱两个月后,10月26日,腾讯混元迎来第一次“批量上新”,并且对外开放。首先,通过测试申请的用户,都能够在“混元”上画画了——从生成图像的准确度、美观度而言
2023-10-29 10:13:00
腾讯汤道生:打破AI“落地玻璃”,让可见变为可用
本文转自:新华网腾讯集团高级执行副总裁、云与智慧产业事业群CEO 汤道生5月17日,“腾讯云生成式AI产业应用峰会”在北京举办,大会披露了腾讯混元大模型、行业大模型的最新能力升级
2024-05-18 10:29:00
大模型应用疯狂加速,洗牌却在静悄悄进行了
...公布了文心一言大模型开源。与此同时,“姗姗来迟”的腾讯混元大模型,一亮相便“秀”起了“肌肉”,科大讯飞与华为合作发布“星火一体机”,进一步把大模型端侧应用摆在了台面上。一波接
2023-10-07 15:24:00
腾讯自研混元大模型亮相,将通过腾讯云对外开放
...入长跑期,从参数至上转向实用优先。在今天举行的2023腾讯全球数字生态大会上,腾讯混元大模型亮相,并宣布通过腾讯云对外开放。据悉,腾讯混元大模型是由腾讯全链路自研的通用大语言
2023-09-07 13:57:00
最强国产多模态刚刚易主!腾讯混元把GPT-4/Claude-3.5都超了
...中文多模态大模型测评基准SuperCLUE-V,新鲜出炉:特别是腾讯的hunyuan-vision、上海AI Lab的InternVL2-40B
2024-08-09 09:38:00
混元已接入腾讯50多个业务,国产大模型将加速转入长跑期?
...优先,国产大模型正在进入长跑期。今日(9月7日),2023腾讯全球数字生态大会在深圳宝安举行。在大会上,腾讯集团高级执行副总裁、腾讯云与智慧产业事业群CEO汤道生宣布,腾讯自
2023-09-07 18:01:00
腾讯推出新一代大模型“混元Turbo”,性能大幅提升,定价低50%
9月5日,腾讯宣布推出新一代大模型“混元Turbo”,相比前代模型,腾讯混元Turbo性能有显著提升,训练效率提升108%
2024-09-05 17:29:00
腾讯推出新一代大模型「混元Turbo」,性能大幅提升,定价低50%
鞭牛士 9月5日消息,腾讯宣布推出新一代大模型“混元Turbo”。腾讯介绍,该模型采用MoE架构,比上一代产品推理效率提升100%,推理成本降低50%,解码速度提升20%。腾讯公
2024-09-05 14:28:00
更多关于科技的资讯:
【宅男财经|专家面对面】1月20日晚,李亚鹏在社交媒体发布视频,配文“再次感恩感谢大家对嫣然的关注,我们还有很长的路要走
2026-01-21 11:04:00
从“单项冠军”到“全能选手” 承德钒钛的市场驱动转型记
1月15日,承德钒钛产品技术室负责人冯国晟向记者展示高纯无氧化二钒样品。河北日报记者 李东宇摄1月15日上午,承德钒钛新材料有限公司钒钛事业部实验室里
2026-01-21 08:28:00
豆包与浦东美术馆达成合作,成为卢浮宫、毕加索双展官方AI讲解员
河北新闻网讯(记者 李春炜)1月20日,字节跳动旗下豆包与上海浦东美术馆达成合作,成为该馆两项国际大展——“图案的奇迹
2026-01-21 09:59:00
索乙“一人公司”的蓬勃发展,高度依赖于由前沿技术、赋能政策、开放产业和宽容文化共同构成的“创新气候”。它既代表了数字经济时代个体力量的崛起
2026-01-21 10:22:00
从管理执行转向双向赋能每日商报讯 近日,“人机共生·智启未来”2025中国年度最佳雇主长三角颁奖活动在上海虹桥国际中央商务区举行
2026-01-21 07:28:00
量质齐升 破局前行每日商报讯 杭州海关最新统计数据显示,2025年浙江省进出口总值达5.55万亿元,同比增长5.4%,高出全国1
2026-01-21 07:28:00
曹一琳摘要:当前,市场经济深化发展,人力资源管理效率成为影响国有企业核心竞争力的关键因素。研究表明,高效的人力资源管理能够助力国有企业优化人才结构
2026-01-21 06:55:00
用AI技术为青少年心理“把脉”!这一项目成功入围2026年度河南省科技攻关项目
大河网讯 近日,河南省科学技术厅公示 2026年度河南省科技攻关拟立项项目,由科创联达(河南)科技有限公司与中原工学院联合申报的“多模态融合与大语言模型驱动的青少年心理健康智能监测研究”项目入选
2026-01-20 22:45:00
张宣科技:科技驱动打造绿色低碳新能源标杆
图为张宣科技技术骨干正在对水系统设备进行全面巡视检查。于飞摄河北新闻网讯(王杨、马薇)打造全球领先的绿氢绿能耦合冶金示范
2026-01-20 17:17:00
聚焦临沂两会」临沂市政协委员许金龙:以科技创新引领标志性产业链高质量发展
鲁网1月20日讯“抢抓人工智能战略风口,以科技创新为核心引擎赋能产业升级,推动我市标志性产业链向高端化、智能化、绿色化方向提质进阶
2026-01-20 17:23:00
中国消费者报北京讯(记者裴莹)1月19日,荣耀与泡泡玛特合作推出的“荣耀500 Pro MOLLY 20周年限定版”手机正式发布
2026-01-20 17:30:00
中国消费者报北京讯(记者孙蔚)近日,转转集团发布《2025二手消费年度洞察》(以下简称报告)。报告显示,05后成为二手消费新生力量
2026-01-20 17:30:00
中国消费者报北京讯(记者桑雪骐)1月19日,海信召开2026 RGB-Mini LED影游旗舰E8S新品发布会,正式推出影游旗舰E8S系列电视
2026-01-20 17:30:00
春节将至 在中国空间站怎么吃年夜饭?
中国消费者报报道(记者桑雪骐)航天员的手指轻轻按下一个特制设备的启动键,28分钟后,伴随着设备上的按键灯闪烁,取出的不是常见的复热食品袋
2026-01-20 18:00:00
大皖新闻讯 1月20日,记者从阜阳市商业局获悉,为全力推动“超级皖”美食争霸赛半决赛活动氛围,该市将发放60万元消费券
2026-01-20 18:14:00