我的订阅
科技

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

阿里Qwen3登顶全球最强开源模型，用8款模型夺回中国AI话语权

类别：科技发布时间：2025-04-29 16:17:00 来源：搜狐科技

出品 | 搜狐科技

作者 | 梁昌均

编辑 | 杨锦

一口气开源8款模型，阿里通义又上新！

4月29日一大早，阿里开源发布Qwen3，包括两款MoE（混合专家架构）模型，其中具备2350亿参数规模的Qwen3-235B-A22B，在对比测试中成为目前最强大的开源模型。

此外，Qwen3还包括六款稠密模型，涵盖6亿、17亿、40亿、80亿、140亿和320亿等多参数，这些模型均未采用MoE设计，主打适配多场景。

“这才是真正的Open AI之道”“让开源再次伟大”……在坚持AI开源这条路上，阿里似乎又夺回了一度失去的话语权。

这也意味着，大模型技术还没卷到头，尤其是DeepSeek爆火以来，OpenAI、谷歌、Meta和阿里、百度、字节成为核心的PK力量，DeepSeek还在憋大招，开源的这把火要越烧越旺了。

以训练Agent为中心

阿里公布的测试显示，旗舰模型 Qwen3-235B-A22B （激活参数为220亿）在代码、数学、通用能力等基准测试中，媲美甚至超过DeepSeek-R1、o1、o3-mini、Grok-3和谷歌Gemini-2.5-Pro等顶级模型。

在大模型竞技场推出的综合能力评估ArenaHard、美国数学竞赛测试AIME24和AIME25，以及编程LiveCodeBench、CodeForces等九大测试中，Qwen3-235B-A22B的得分均超过DeepSeek-R1、o1、o3mimi、Grok-3，但部分表现仍不及Gemini-2.5-Pro。

同时，在主流开源模型中，Qwen3-235B-A22B也在通用任务、数学和科学任务、多语言任务和代码任务上，全面超越Meta在4月初发布的LLaMA-4-Maverick和DeepSeek-V3模型，成为目前最强大的开源模型。

值得一提的是，Qwen3-235B-A22B相对而言，参数规模更小，大约仅有R1和V3参数规模的（6710亿）的35%，同时低于o1（约3000亿）和LLaMA-4-Maverick（超4000亿），实现了小而美、以小博大的性能。

这样的能力同样体现在其它模型当中。另一款小型MoE模型Qwen3-30B-A3B的激活参数量仅有30亿，仅有QwQ-32B的10%，更远低于DeepSeek-V3（总参数6710亿、激活370亿）和GPT-4o的参数规模，在前述九项测试中表现更胜一筹。

就连Qwen3-4B这样仅有40亿参数的模型，也能匹敌Qwen2.5中具有720亿参数模型的性能，数学、编码等测试也能超过DeepSeek-V3和GPT-4o。

Qwen3模型的一大亮点还在于，具备快思考和慢思考两种模式。对于需要深入思考的复杂问题，模型会逐步推理，经过深思熟虑后给出最终答案。对于速度有要求的简单问题，模型则提供快速、近乎即时的响应，让用户实现对模型思考程度的控制。

阿里通义团队认为，这两种模式的结合增强了模型实现稳定且高效的思考预算控制能力，让用户能够更好地为不同任务配置特定预算，在成本效益和推理质量之间实现更优的平衡。

同时，由于模型架构的改进、训练数据的增加以及更有效的训练方法，Qwen3稠密基础模型的性能与参数更多的Qwen2.5基础模型相当，从而节省了训练和推理成本。

数据显示，Qwen3-235B-A22B 仅需4张H20就能本地部署，而DeepSeek-R1推荐16卡H20配置，意味着Qwen 3旗舰模型部署成本相比R1下降七成多。

据阿里百炼平台，该模型API调用费用为4元/百万Token，和R1的4元/百万Token（缓存未命中）输入价格相当，远低于R1 16元/百万Token的输出价格。

此外，Qwen3模型还对Agent和代码能力进行了优化，推出了Qwen-Agent工具库，其封装了工具调用模板和解析器，降低了代码开发复杂度。此外，模型还支持最近火热的MCP（模型上下文协议），用户可以调用内置工具或自行集成其他工具。

此前，阿里云已推出MCP服务，并提出要做Agent Store。可以说，在智能体即将迎来爆发的时刻，阿里在模型、工具、应用上做好了全面准备。

比如，此次Qwen 3的六款稠密模型就能适配不同场景，包括科研侧、手机侧、汽车侧，以及开发者和企业大规模部署等。

“我们认为，我们正从专注于训练模型的时代过渡到以训练 Agent为中心的时代。”通义团队表示。

从Qwen3模型发布后的反馈来看，不少人都对其发出了称赞，认为这是目前最好的开源模型。“这是中国超越了自己，成为AI开源的新力量，意味着模型发展势头并没有放缓。”有海外用户提到，还有用户希望看到Qwen3与o3的测试对比。

当然，Qwen3模型似乎也并非完美。有用户表示，Qwen3在其个人评估测试中产生了好坏参半的结果，并且没有接近SOTA（最先进）。

该用户在使用开发框架Next.js进行TODO应用开发时，Qwen3-235B-A22B 与Claude 3.7 Sonnet和Gemini 2.5 Pro等顶级模型相当，代码运行没有问题，但没有严格遵循指令，生成的可视化内容因太小而难以阅读。

此外，多位用户还提到，Qwen3存在过度思考的问题，导致思考过程太长，而且默认的思维模式对更复杂的任务来说非常不可用，因此思考模式需要用户进行切换。

争夺大模型话语权

Qwen3模型性能的提升，得益于阿里通义团队在预训练和后训练上的多方面优化。

在预训练阶段，Qwen3的数据集达到约36万亿token，涵盖119种语言和方言，是Qwen2.5采用的数据集规模的两倍。这种规模在全球居于前列，如GPT-4、LLaMA-4等训练数据规模都在20万亿token之下。

Qwen3还使用了合成数据，比如为增加数学和代码数据，利用Qwen2.5的数学和代码模型，合成了包括教科书、问答对以及代码片段等多种形式的数据。

在后训练方面，在模型具备基本推理能力的基础上，通义团队利用大规模强化学习继续增强模型能力，还在指令遵循、格式遵循和Agent能力等20多个通用领域任务上应用了强化学习，在保证模型推理能力增强的同时，提高了通用能力。

“Qwen3代表了我们在通往通用人工智能和超级人工智能旅程中的一个重要里程碑。”通义团队表示，通过扩大预训练和强化学习的规模，实现了更高层次的智能。

该团队表示，未来计划从多个维度继续提升模型，包括优化模型架构和训练方法，实现扩展数据规模、增加模型大小、延长上下文长度、拓宽模态范围等目标，并利用环境反馈推进强化学习以进行长周期推理。

实际上，这也是目前国内外大模型正在追求的重点方向，如最近先后更新GPT-4o和o3的OpenAI，在多模态和推理能力方面进一步强化。

在阿里所坚持的模型开源这条路上，虽然Qwen系列模型此前超越Llama，成为全球第一开源模型家族。DeepSeek此前一度夺走了注意力，更是引发了新一轮的大模型技术竞赛。

这个月初，Meta开源最新的LLaMA-4模型，随后快速冲上Chatbot Arena 排行榜第二，仅次于Google刚发布的 Gemini 2.5 Pro。

但很快LLaMA-4面临利用公开测试集进行训练刷榜的质疑，有测试者还发现，在部分官方没有展示的基准测试中，其表现不尽人意。

当然，Meta方面予以否认，但承认模型性能存在参差不齐的问题。目前，规模最大、性能最强的LLaMA-4- Behemoth模型仍在训练中。Meta能否憋个大招扳回一局，还要再看看。

在憋大招的还有DeepSeek。随着阿里、百度、OpenAI、谷歌、Meta等先后推出最新模型，DeepSeek此前一度登顶的V3和R1模型失去绝对领先优势，全世界都在等待R2模型的推出。

此前3月有报道称，DeepSeek正在加快R2的研发和发布进程，原计划在5月初发布，但希望在3月中旬推出，当时这种说法遭到DeepSeek方面否认。

最近一个月，外界都在猜测R2何时会发布，根据业内产品迭代周期，不少看法认为会在5月，这可能意味着R2进入发布倒计时。

最新爆料称，R2依然采用MoE架构，拥有1.2万亿参数，成本GPT-4o便宜97.3%，视觉能力更强。

搜狐科技注意到，这在DeepSeek交流群引发了谈论，有观点认为，即便要发R2，也应该先发V4，R1正是以V3为基础而进行训练，但DeepSeek方面未对R2有关消息做出回应。

对阿里来说，开源是面对市场竞争的核心策略，但这也意味着只有性能做到领先，开源才有意义。正如DeepSeek一开源，就得到很多企业的主动适配和支持。

因此，对开源的AI企业来说，技术层面的持续进步就显得非常关键，这是推动应用爆发和生态构建的基础。随着阿里更新Qwen3模型，这一场AI开源的竞赛无疑又变得更加紧迫了。返回搜狐，查看更多

以上内容为资讯信息快照，由td.fyun.cc爬虫进行采集并收录，本站未对信息做任何修改，信息内容不代表本站立场。

快照生成时间：2025-04-29 17:45:06

本站信息快照查询为非营利公共服务，如有侵权请联系我们进行删除。

信息原文地址：

更多关于模型,阿里,话语权,中国,话语,全球的资讯：

赵雪波|中国气候传播的逻辑与路径——评《“他者”气候报道中的

...一、运用气候正义话语框架阐释他者国家立场，争夺气候话语权；二、加强气候变化议题的多传播主体联动，大力开展气候公共外交；三、重视气候生态公民形象建构，讲述他者气候治理故事；四、

2025-04-01 22:15:00

为什么说oppo是中国品牌的标杆？

...中国品牌在撕掉“低质”标签的同时，技术上掌握了更多话语权。这份“话语权”在知识产权领域体现的更加明显。2023年12月，OPPO和诺基亚多年的专利纠纷有了结论，重庆市第一中级

2024-01-10 11:55:00

混沌初开：国产大模型在沸腾中“求索”

...率先应用落地，布局商业化，谁就有可能在AI 2.0时代掌握话语权。创业者们的三大难关：钱、技术、人才大模型烧钱是赛道参与者的共识。启明创投合伙人周志峰在媒体采访时表示，一家大

2023-05-31 16:00:00

提升人工智能安全治理的中国话语权

...同治理人工智能安全的共同目标，牢牢掌握国家自主权与话语权，通过对话和合作凝聚国际共识。三是强化人工智能安全治理的科技伦理原则。坚持推动“科技向善”“智能向善”成为世界各国共识

2024-04-08 03:56:00

菜鸟，第二次走出舒适区

...递业最重要的基础设施之一。后来，面对四通一达在行业话语权上的式微，以及更大的产业野心，菜鸟亲自上阵送快递，今年还推出了直营快递品牌菜鸟速递。这还不够，在快递物流平台的基础上，

2023-10-10 15:01:00

动力电池领域正在呈现马太效应，是好事还是坏事？

...、搜索、社交及汽车制造等领域成为巨头，掌握着绝对的话语权，影响全球经济走向。英伟达是这轮AI潮流的最大赢家，这家芯片制造商从今年年初开始发力，市值在到达3万亿美元的高位后稍微

2024-07-22 09:30:00

数字时代的“脑力”革命！总台《赢在AI+》探索“智能芯算”

...搬运效率提升了15%以上，为中国半导体产业赢得了宝贵的话语权。△AI创想者柯娜“大模型”百舸争流推动各行各业智能化升级提到大模型、云计算，大家一定都不陌生，但它们究竟是何关系

2025-07-04 11:55:00

500亿收购131亿卖出！阿里血亏处理掉大润发，曝接盘者是陈

...将大润发转卖，从而抛售其起初占据的73.66%股份，从而在话语权上完全和大润发毫无关系。与此同时，就连大润发也在同一时间于企业内部平台分布对应的信件，从而不仅向自己的广大员工

2025-01-04 19:22:00

快递物流下半场，“卷”向哪里？

...同质化更高的今天，没有多条腿走路的能力，也就意味着话语权的拱手相让。对所有物流玩家来说，下半场更高阶的较量才刚开始。「掘金“同城”，有的放矢」有物流行业专家曾说，行业卷的本质

2024-09-14 14:02:00

更多关于科技的资讯：

杭州发布两产品年度质量报告：保温杯和童鞋，多买“杭产品”

12月26日，杭州市市场监督管理局召开专题新闻通气会，对外公布了2025年不锈钢真空杯与儿童旅游鞋两类产品的质量比对结果

2025-12-27 07:39:00

“梦溪杯”宋韵文化创新大赛颁奖同期发布宋韵纹样3.0版展

昨天下午，2025“梦溪杯”宋韵文化创新大赛颁奖典礼在杭州凤凰里文创园举行。自10月15日启动至11月20日截稿，大赛共收到来自英国

2025-12-27 07:39:00

蓝天下郑伟龙：种地星球是个温暖治愈的“慢”星球

杭州市西湖区后陡门58号，原本只是城市边缘一个普通的小村子，仅仅三年，这里已经蜕变成“种地星”人的共同家园。这个开园仅两个多月的农文旅融合空间

2025-12-27 07:39:00

快递红酒为什么摔不破？菜鸟有个绿色包材实验室

装有红酒的纸箱从1米多的高度多次抛下，又被送入抗压测试机内，接受300公斤的压力测试，再经斜面冲击台俯冲撞向铁板，红酒依然完好无损……经过这一系列流程

2025-12-27 07:39:00

近八成职场人借助AI开展工作超四成职场人会与AI交流情感

近日，智联招聘发布的《2025雇佣关系趋势报告》显示，78.2%的职场人每周至少使用一次AI工具开展工作。该《报告》基于大量调研问卷生成

2025-12-27 07:39:00

北京2026人形机器人半马全面升级

原标题：北京2026人形机器人半马全面升级明年4月19日开启“人机共跑” 赛事报名通道正式开启2025年4月19日，北京亦庄半程马拉松暨人形机器人半程马拉松在北京亦庄鸣枪开跑

2025-12-26 15:22:00

深耕健康科技二十五载倍轻松以创新驱动智能健康生态升级

2025年12月25日，智能便携按摩器企业倍轻松（688793.SH）披露公告显示，公司及实际控制人马学军因涉嫌信息披露违法违规

2025-12-26 16:02:00

肥乡联社多维度发力深耕网点服务升级

肥乡联社始终坚守“以客户为中心”的服务理念，立足县域金融服务实际，以“精细化”为核心抓手，从环境优化、能力提升、特色服务三个维度发力

2025-12-26 16:37:00

中国人寿成功举办AI大模型竞赛，系统锻造人工智能实战能力

日前，中国人寿保险股份有限公司（以下简称“中国人寿”，股票代码：601628.SH，2628.HK）首届AI大模型竞赛在该公司科技园成功举办

2025-12-26 16:52:00

匠心筑梦智启新程---华夏银行临沂分行2025年度私人银行

鲁网12月26日讯2025年12月12日，华夏银行临沂分行2025年度私人银行客户私享峰会于国金中心荣耀启幕。十六位精英客户应邀赴约

2025-12-26 17:00:00

博士创新站典型案例｜河北易达核联机械制造股份有限公司博士创新

在全球能源清洁低碳转型的浪潮中，核电凭借稳定高效的特性，战略地位愈发凸显，事关国家能源安全与产业未来。面对核电高端套筒长期依赖进口

2025-12-26 17:22:00

博士创新站典型案例｜河北镁神科技股份有限公司博士创新站：校地

在无机盐镁质新材料领域，轻质高纯氧化镁是新能源电池、电子陶瓷等高端产业不可或缺的核心基础材料，其核心技术长期被发达国家企业垄断

2025-12-26 17:23:00

博士创新站典型案例｜容创未来（沧州）新能源有限公司博士创新站

容创未来（沧州）新能源有限公司获批建设河北省博士创新站推动“教学—科研—产业”三方联动为区域经济高质量发展注入科技动能前不久

2025-12-26 17:31:00

博士创新站典型案例｜河北创鉴科技集团有限公司博士创新站：为物

我国物流行业正处于数字化、智能化转型关键期，降本增效与技术升级的双重需求驱动行业变革。当前，中小物流企业普遍面临技术落地难

2025-12-26 17:33:00

湖南和硕智联：智能制造引领鞋业新风尚(图)

在湘中腹地隆回县东南工业园区，一家现代化的制鞋企业正以令人瞩目的姿态快速发展。湖南和硕智联运动用品有限公司，作为香港永京集团在华中地区的重要布局

2025-12-26 17:34:00

头条订阅服务

阿里Qwen3登顶全球最强开源模型，用8款模型夺回中国AI话语权