• 我的订阅
  • 科技

阿里千问最强模型重磅亮相!性能媲美GPT-5.2、Gemini 3 Pro

类别:科技 发布时间:2026-01-27 07:38:00 来源:海外网

1月26日,阿里正式发布千问旗舰推理模型Qwen3-Max-Thinking,创下数项权威评测全球新纪录,性能媲美GPT-5.2、Gemini 3 Pro,成为迄今为止最接近国际顶尖模型的国内最强AI大模型。通过总参数、强化学习、推理计算的极致规模扩展,千问新模型实现了性能的大幅飞跃,刷新科学知识(GPQA Diamond)、数学推理(IMO-AnswerBench)、代码编程(LiveCodeBench)等多项关键性能基准测试的全球纪录。

阿里千问最强模型重磅亮相!性能媲美GPT-5.2、Gemini 3 Pro

Qwen3-Max-Thinking是目前阿里规模最大、能力最强的千问推理模型,其总参数量超万亿(1T),预训练数据量高达36T Tokens。此前,预览版Qwen3-Max-Thinking斩获数学推理AIME 25和HMMT 25的国内首个双满分,推理性能已让人惊艳;在此基础上,阿里通义团队进行了更大规模的强化学习后训练,全面提升了正式版Qwen3-Max-Thinking性能:在涵盖事实知识、复杂推理、指令遵循、人类偏好对齐、Agent能力等19个公认的大模型基准测试中,千问旗舰推理模型刷新了数项最佳表现(SOTA)纪录,整体性能可媲美 GPT-5.2-Thinking-xhigh、Claude Opus 4.5 和 Gemini 3 Pro 。

在关键的模型推理能力提升中,千问新模型采用了一种全新的测试时扩展(Test-time Scaling)机制,推理性能提升的同时还更经济。业界普遍的推理时计算,只会简单增加并行推理路径,重复推导已知结论,造成冗余推理效率低下;而千问采用的这一新机制,可对此前推理的结果进行“经验提取”式的提炼,并据此进行多轮自我迭代,在相同的上下文中实现更高效的推理计算,获得更智能的推理结果。基于这一推理技术创新,千问推理性能和推理效率大为提升,比如在启用工具的“人类最后的测试”HLE中,千问得分58.3,大幅超过GPT-5.2-Thinking的45.5、Gemini 3 Pro的45.8,录得当前所有模型的最高分。

面向即将到来的智能体Agent时代,Qwen3-Max-Thinking还大幅增强了自主调用工具的原生Agent能力。具体而言,在完成初步的工具使用微调后,通义团队对模型进一步在大量多样化任务上进行了基于规则奖励与模型奖励的联合强化学习训练,使得Qwen3-Max-Thinking拥有更智能结合工具进行思考的能力。这种自适应的工具调用能力可在QwenChat上完整体验,模型自主选用搜索、个性化记忆和代码解释器等三个核心的Agent工具功能,提供专业人士一样水平的回答,更合用户心意、更智能、更流畅;同时,模型幻觉也大为降低,为解决真实复杂任务打下基础。

目前,开发者可在QwenChat上免费体验Qwen3-Max-Thinking模型,企业可通过阿里云百炼获取新模型API服务,普通用户也可通过千问PC端和网页端试用模型。据了解,千问APP也即将接入新模型,所有用户都可免费体验千问最强模型。

责编:秦雅楠、李萌

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2026-01-27 08:45:01

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

阿里云重磅升级全栈AI体系,一文看懂云栖大会技术发布
9月24日,2025云栖大会,阿里巴巴集团CEO吴泳铭宣布阿里云重磅升级全栈AI体系,实现从AI大模型到AI基础设施的技术更新。面向新一轮智能革命,阿里云将全力打造成为全栈人工智
2025-09-24 13:30:00
阿里云CTO周靖人:全面投入升级AI大基建
快科技9月19日消息,在2024杭州云栖大会上,阿里云CTO周靖人表示,阿里云正在围绕AI时代,树立一个AI基础设施的新标准,全面升级从服务器到计算、存储、网络、数据处理、模型训
2024-09-19 15:53:00
阿里AI三连发,连夺三项第一
7月25日,阿里巴巴全新开源千问3推理模型,性能大幅提升,一举夺下「全球最强开源模型」王座,比肩顶级闭源模型Gemini-2
2025-07-25 21:34:00
阿里云通义千问主力模型价格直降97%,大模型商业化拐点已至
5月21日,阿里云抛出重磅炸弹:通义千问GPT-4级主力模型Qwen-Long,API输入价格从0.02元/千tokens降至0
2024-05-22 16:18:00
李飞飞团队“50美元”复现DeepSeek R1?真相是…
s1模型的训练并非从零开始,而是基于阿里云通义千问(Qwen)模型进行监督微调。s1模型的神奇“低成本”,是建立在已具备强大能力的开源基础模型之上,可谓依然是开源的胜利。作者 |
2025-02-07 06:25:00
阿里最新开源推理模型发布:性能比肩DeepSeek-R1
阿里通义发布最新开源推理模型,称其性能比肩DeepSeek-R1。3月6日凌晨,阿里巴巴正式发布最新的开源推理模型通义千问QwQ-32B
2025-03-06 13:22:00
阿里云全面升级GPU云服务:AI大模型推理性能可提升100%
快科技7月19日消息,阿里云推出全面升级的GPU云服务,通过全新优化GPU套件,多GPU推理服务性能可最大提升100%
2024-07-19 17:21:00
昨天凌晨,阿里巴巴又默默干了件大事:发布并开源全新的推理模型通义千问QwQ-32B。千问QwQ-32B是阿里探索推理模型的最新成果
2025-03-07 07:27:00
阿里云AI基础设施获2024世界互联网大会领先科技奖
11月19日,2024年世界互联网大会领先科技奖在乌镇揭晓,阿里云面向AI的云计算基础设施荣获该奖,成为世界互联网大会史上首个以AI基础设施整体获奖的科技成果。面向AI时代,阿里
2024-11-19 18:59:00
更多关于科技的资讯:
新春走基层|大数据里的“挖矿人”
2月2日,河北燕鼎数据处理有限公司,数据标注员正在专注工作。河北日报记者潘文静摄2月2日上午,走进河北燕鼎数据处理有限公司上千平方米的开放式办公室
2026-02-04 21:07:00
安徽省人大代表韩东成:建议引入专业化人形机器人园区运营管理机构,提供“一站式”服务
大皖新闻讯 当前,全球新一轮科技革命和产业变革深入发展,人形机器人产业作为集成人工智能、高端制造、新材料等技术的战略性新兴产业
2026-02-04 21:37:00
聚焦中小商户痛点,好哒全链路赋能数字化转型
当前,大量传统中小商户面临“不会营销、不懂管理”的经营困境,数字化转型需求迫切。作为迅付科技旗下数字化商户服务平台,好哒精准洞察行业痛点
2026-02-04 22:22:00
随手一拍皆大片——首届中国手机摄影大展织就“视觉江苏”
手机影像的普及,让“人人都是创作者”从理念成为现实。2月4日,首届中国手机摄影大展暨摄影名家手机作品展江苏站巡展在南京市江宁美术馆拉开帷幕
2026-02-04 20:11:00
泰安光明爱尔眼科医院引入视达热脉动治疗仪 开启干眼治疗新体验
鲁网2月4日讯近日,泰安光明爱尔眼科医院引入“视达热脉动治疗仪”,为饱受干眼困扰的患者带来更先进、舒适的治疗选择。作为目前干眼治疗领域的前沿设备之一
2026-02-04 17:45:00
春运大幕拉开,热门线路车票秒空,第三方平台推出的“全能抢票”“极速加速包”等付费服务刷屏,打着“提升成功率”“专属通道”的旗号
2026-02-04 18:04:00
“智能化”家居年货受欢迎,擦窗机器人在抖音电商订单量同比增209%
(华商网讯 记者 叶绥波)新春佳节将至,年货市场持续升温,年货采购进入高峰期。《2026抖音电商年货消费趋势数据报告》(以下简称“报告”)显示
2026-02-04 18:37:00
中新经纬2月4日电 (宋亚芬)2月2日,阿里巴巴旗下千问APP宣布投入30亿元启动“春节请客计划”,将于2月6日正式上线
2026-02-04 14:26:00
山东省宠物行业高质量发展论坛在济南举行
山东宠业共筑清朗生态 擘画高质量发展新蓝图鲁网2月4日讯据山东省宠物协会介绍,2026山东省宠物行业高质量发展论坛于1月30日至31日在济南举行
2026-02-04 15:26:00
每日商报讯 记者从杭州市民卡公司了解到,为进一步整合资源、优化体验,金投·市民卡数字体验中心将于2月15日起停止对外服务
2026-02-04 15:35:00
【宅男财经|专家面对面】微信派公众号4日发文称,近期收到用户针对元宝的反馈和投诉,其相关春节营销活动诱导用户高频分享链接到微信群等场景
2026-02-04 15:47:00
浙江乐清:传统电气产业向高端化绿色化融合化迈进
新年伊始,位于乐清市北白象镇的加西亚电子电器股份有限公司已按下智能制造升级快进键,三楼“智能工厂”建设如火如荼,机器轰鸣
2026-02-04 16:22:00
技术赋能双馆 浙大城市学院“智绘”团队激活杭州文博新活力
2026年1月下旬,浙大城市学院“智绘”团队在领队高峰老师的牵头组织下,开启“文博技术赋能专项行动”,先后走进杭州中国动漫博物馆与良渚博物院两大文化地标
2026-02-04 16:36:00
西安航天基地重点商业地标启幕赋能区域民生消费双升级
2月4日,作为西安航天基地重点商业配套的星旋广场启幕,为群众带来一站式消费新体验,也为航天基地产城融合与高质量发展注入新动能
2026-02-04 15:27:00
长白时评评论员 张悦近日在社交平台有人发帖称,店内循环播放的广告歌音乐,是否会对店员造成心理影响,该帖子引发热议。对此
2026-02-04 14:06:00