• 我的订阅
  • 科技

DeepSeek-R1联网搜索能力首测:腾讯元宝第一

类别:科技 发布时间:2025-03-11 19:19:00 来源:浅语科技

快科技3月11日消息,国产大模型DeepSeek-R1爆火后,许多第三方平台陆续接入了该模型,比如腾讯、阶跃星辰、蚂蚁集团、百度、字节跳动等等。

今日,中文大模型测评基准SuperCLUE发布DeepSeek-R1联网搜索能力首测,公布了10家第三方平台测评结果。

从结果来看,腾讯元宝是本次测评中唯一一个超过80分的第三方平台,以80.61分领跑联网搜索测评榜单,腾讯元宝在总分、基础检索能力和分析推理能力三个关键指标上均位列第一。

阶跃AI以74.49分的总分位居第二,支付宝百宝箱以73.47分位居第三,而其他平台在本次测评中则处于不同的梯队,性能存在一定的差异。

DeepSeek-R1联网搜索能力首测:腾讯元宝第一

各个第三方平台在基础检索能力上平均得分为95.45,而在分析推理能力上的平均得分仅有35.35,相差近60分。

同一平台在基础检索能力和分析推理能力两大维度上的表现也同样差异明显,所有平台的分析推理能力得分都明显低于基础检索能力。

SuperCLUE表示,这反映出在更高级的认知任务,例如理解、分析、推理和解决复杂问题方面,仍有很大的进步空间。

回复率上,飞书知识问答、阶跃AI、腾讯元宝和支付宝百宝箱在联网搜索回复率方面表现优秀,完整回复率均为 100%,截断率和无回复率均为零,成为第一梯队。

秘塔AI搜索、纳米AI搜索和天工AI紧随其后,构成第二梯队,其他平台也均有超过85%的完整回复率,都表现出了较强的稳定性。

耗时方面,总平均耗时从最少的字节火山引擎(17.12秒/题)到最多的MiniMax(73.51秒/题),差距非常显著。

整体来看,耗时分布范围较广,不同平台之间的搜索效率差异较大。

另外,所有平台在分析推理能力上平均耗时都明显高于基础检索能力。

DeepSeek-R1联网搜索能力首测:腾讯元宝第一

DeepSeek-R1联网搜索能力首测:腾讯元宝第一

DeepSeek-R1联网搜索能力首测:腾讯元宝第一

DeepSeek-R1联网搜索能力首测:腾讯元宝第一

DeepSeek-R1联网搜索能力首测:腾讯元宝第一

【本文结束】如需转载请务必注明出处:快科技

责任编辑:拾柒

文章内容举报

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2025-03-11 20:45:09

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

腾讯元宝AI搜索解析能力升级:单文档支持1000万文字处理
快科技6月21日消息,据媒体报道,腾讯旗下的AI大模型应用“腾讯元宝”近日进行了重要升级,显著提升了其AI搜索及解析能力,为用户带来了更高效、便捷的信息处理体验。新版本的腾讯元宝
2024-06-21 13:34:00
腾讯元宝 AI 搜索解析能力升级,支持千万字超长文处理
IT之家 6 月 21 日消息,腾讯旗下 AI 大模型应用“腾讯元宝”迎来1.1.7 版本升级,其 AI 搜索及解析能力得到提升
2024-06-21 09:26:00
“混元”迭代,大模型App腾讯元宝正式上线
本文转自:人民日报客户端5月30日,腾讯宣布旗下混元大模型全面升级,基于混元大模型的App“腾讯元宝”正式上线。腾讯元宝提供了AI搜索、AI总结、AI写作等核心能力;面向日常生活
2024-05-30 18:23:00
腾讯大模型APP腾讯元宝上线,公司2、3月已申请“腾讯元宝”商标
5月30 日,腾讯宣布旗下混元大模型全面升级,基于混元大模型的App“腾讯元宝”正式上线,苹果及安卓应用商店均可下载。相比此前测试阶段的混元小程序版本,腾讯元宝聚焦AI效率工具,
2024-05-30 17:33:00
从AI搜索到语音陪练,腾讯元宝全面评测来了!大模型C端玩家谁更胜一筹?
...火热态势依旧不减。30日,基于混元大模型的AI助手App“腾讯元宝”上线,标志着BAT终于在AI消费C端应用领域聚首。据介绍,自2023年9月首次亮相以来,腾讯混元大模型的参
2024-05-31 18:07:00
大模型App上线 腾讯晚不晚
...App上线晚3个月、半年,长时间看都不是太重要的事。”腾讯云副总裁、腾讯混元大型的AppI写作能下大模型标也不是模型负责人刘煜宏对于腾讯大模型App后发并不焦虑。5月30日,
2024-05-31 00:32:00
腾讯刚出的这个App,要彻底掏空微信
...有的功能,就要被时代淘汰一样...最近呢,连一向稳重的腾讯都坐不住了。给自家的混元大模型应用——元宝加了不少新东西。让机哥比较感兴趣的,就是它的AI搜索能力得到了比较明显的加
2024-07-20 12:08:00
国泰君安:维持腾讯控股“增持”评级 目标价459港元
国泰君安(7.9, 0.03, 0.38%)发布研究报告称,维持腾讯控股(374.8, -6.80, -1.78%)(00700)“增持”评级
2024-06-08 22:36:00
腾讯元宝“上桌”,AI助手之争再起波澜
...美 圻“欢迎测试”——5月30日,马化腾在朋友圈亲自为腾讯元宝APP的上线站台。这条朋友圈,也意味着蓄势已久的腾讯正式加入如火如荼的AI助手大战。腾讯混元大模型之所以此时才发
2024-06-03 16:59:00
更多关于科技的资讯:
江南时报讯 在金融服务日益普及与下沉的今天,丹阳农商银行积极响应国家发展普惠金融号召,坚定“做小做散”战略定位,以收款码业务为抓手深耕本土
2026-02-05 23:52:00
江南时报讯 为深入贯彻落实全行零售业务转型与财富管理升级战略部署,全力锻造一支专业精湛、服务卓越的财富管理队伍,近期,仪征农商银行组织全体财富经理前往南京银行扬州分行
2026-02-06 00:27:00
中亦科技荣膺华为云“2025年度擎帆奖”
2026年1月23日,华为云“同心·共行·致远”北京伙伴大会盛大召开。会上,中亦科技凭借在数据库联合解决方案创新及行业纵深拓展中的卓越表现
2026-02-05 21:33:00
归母净利润预增123% 科沃斯:用专注与具象解码科技
东经120.721093,北纬31.213668,这个坐标点正因一家上市公司的到来,变得充满生机与活力——2月4日16时左右
2026-02-05 19:22:00
合肥年货节设立萌宠专区,把宠物友好写进购物清单
大皖新闻讯 2月5日,2026年第十六届合肥年货节盛大启幕,国内外500余家企业齐聚合肥滨湖国际会展中心。大皖新闻记者发现
2026-02-05 19:59:00
北京海淀开展坚果炒货食品专项检查
近日,北京市海淀区市场监管局开展坚果炒货食品专项检查。本次重点检查产品的生产日期、保质期、生产厂家等信息是否标注清晰,是否存在过期、变质等问题。中国消费者报记者董芳忠摄影报道
2026-02-05 14:37:00
马上元梦 数字新生|元梦空间绘蓝图 马上元梦嘉年华大会蓉城圆满落幕
2026年2月3日,由元梦空间文化传播(成都)有限公司、元界乐享智联(深圳)科技有限公司、全球元宇宙酒店集团、大湾区企业家联合会联合主办的 “马上元梦数字新生——元梦空间2026马上元梦嘉年华大会”在成都温江皇冠假日酒店盛大举行
2026-02-05 15:08:00
第57次《中国互联网络发展状况统计报告》今天发布。报告显示,截至2025年12月,我国网民规模达11.25亿人,互联网普及率突破80%
2026-02-05 15:21:00
2026年1月以来,一款名为OpenClaw(曾用名Clawdbot、Moltbot)的智能体项目在国际开源社区迅速走红
2026-02-05 15:47:00
中国消费者报南京讯(记者桑雪骐)2月4日,苏州奥体中心体育场灯光璀璨,追觅科技与央视携手打造的“敢梦敢为•追觅之夜”演唱会正式举行
2026-02-05 14:37:00
史上首次!米兰冬奥基于阿里千问打造奥运官方大模型
2月5日,米兰冬奥会开幕在即,国际奥委会主席柯丝蒂·考文垂在国际转播中心举行的活动中宣布,国际奥委会已基于阿里千问大模型打造了奥运史上首个官方大模型
2026-02-05 13:40:00
华商观察丨智能儿童手表席卷全球 安全与隐私红灯亮起
智能儿童手表的全球普及浪潮,正伴随技术迭代与家长安全需求快速推进,成为数字时代儿童生活的标志性设备。据 Global Growth Insights 2025 年 12 月发布的行业报告显示
2026-02-05 11:29:00
All in AI, 重塑保险!中国太保首届科技创新大会燃动申城
鲁网2月5日讯当人工智能成为驱动产业变革的核心引擎,保险行业正迎来从传统模式向数智化跨越的关键拐点。1月30日,中国太保以“All in AI
2026-02-05 11:06:00
2026微信小程序开发服务商推荐:技术与服务双维筛选指南
据2025年中国电子商务协会发布的《小程序生态发展白皮书》显示,当年微信小程序交易规模突破8.3万亿元,同比增长41.2%
2026-02-05 08:12:00
义乌世界杯订单生产进入“冲刺期”
2026年美加墨足球世界杯将在6月启幕。从2025年5月开始,义乌市场上的世界杯订单就陆续而至,如今,球迷服装等世界杯相关体育用品的销售和生产已经进入“冲刺期”
2026-02-05 08:19:00