• 我的订阅
  • 科技

阿里AI三连发,连夺三项第一

类别:科技 发布时间:2025-07-25 21:34:00 来源:海外网

7月25日,阿里巴巴全新开源千问3推理模型,性能大幅提升,一举夺下「全球最强开源模型」王座,比肩顶级闭源模型Gemini-2.5 pro、o4-mini。本周阿里已连续开源3款重磅模型,分别斩获基础模型、编程模型、推理模型等主流领域的三项全球开源冠军。两天前开源的AI编程模型Qwen3-Coder,更是引爆全球AI圈,掀起一波用中国千问开源模型替代闭源模型的新浪潮。

最新推出的千问3推理模型,登顶全球最强开源推理模型。 自千问3旗舰模型Qwen3-235B-A22B发布后,阿里通义团队一直在扩展大模型的推理极限,全新开源的千问3推理模型在通用能力和深度思考能力上实现巨大飞跃。千问3推理模型支持256K上下文长度,在知识(SuperGPQA)、编程(LiveCodeBench v6)、数学(AIME25)、人类偏好对齐(Arena-Hard v2)、创意写作(WritingBench)、多语言能力(MultilF)等核心能力上,千问3推理模型完全可比肩Gemini-2.5 pro、o4-mini等顶尖闭源模型,并创下全球开源模型的最佳性能表现。

阿里AI三连发,连夺三项第一

在经典基础模型领域,千问3全球最强。3天前开源的Qwen3-235B-A22B-Instruct-2507(非思考版)新模型,性能显著提升,在GPQA(知识)、AIME25(数学)、LiveCodeBench(编程)、Arena-Hard(人类偏好对齐)、BFCL(Agent能力)等众多测评中表现出色,超越Claude4(Non-thinking)等领先闭源模型。权威AI研究机构Artificial Analysis指出,“千问3是全球最智能的非思考基础模型”。

阿里AI三连发,连夺三项第一

在AI编程领域,新开源的Qwen3-Coder被誉为「全球最好的编程模型」。Qwen3-Coder在代码能力及Agent调用能力方面取得重大突破。在多语言SWE-bench、Mind2Web、Aider-Polyglot等模型Agent能力评估中,Qwen3-Coder超越GPT4.1、Claude4等顶级闭源模型,并登顶全球最大AI开源社区HuggingFace 模型总榜冠军。借助Qwen3-Coder,刚入行的程序员一天就能完成资深程序员一周的工作,生成一个品牌官网最快只需5分钟。

Qwen3-Coder的开源,引爆硅谷科技圈,在全球AI圈掀起一波「AI编程」热潮。推特创始人杰克·多尔西(Jack Dorsey)、爆火Agent应用Perplexity CEO 阿拉温德·斯里尼瓦斯(Aravind Srinivas)、著名风投公司a16z合伙人马克·马斯克罗(Marco Mascorro)等硅谷大咖盛赞Qwen3-Coder,HuggingFace CEO 克莱门特·德朗格(Clement Delangue)更是连转带发12条推文,向全球开发者力荐这一最好的编程模型。海外知名模型API聚合平台OpenRouter数据显示,阿里千问API调用量暴涨,过去几天已突破1000亿Tokens,在OpenRouter趋势榜上包揽全球前三,是当下最热门的模型。

阿里AI三连发,连夺三项第一

截至目前,阿里巴巴已开源300余款通义大模型,通义千问衍生模型突破14万个,超越Meta的Llama系列成为全球第一的开源模型家族,通义也是开发者和企业使用最广泛的大模型。未来三年,阿里巴巴还将投入超过3800亿元用于建设云和AI硬件基础设施,持续升级全栈AI能力,为中国和全球开发者和企业提供更先进的模型和云计算服务。

责编:张靖雯、陈亚楠

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2025-07-25 23:45:01

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

阿里云全面升级GPU云服务:AI大模型推理性能可提升100%
快科技7月19日消息,阿里云推出全面升级的GPU云服务,通过全新优化GPU套件,多GPU推理服务性能可最大提升100%
2024-07-19 17:21:00
阿里云重磅升级全栈AI体系,一文看懂云栖大会技术发布
9月24日,2025云栖大会,阿里巴巴集团CEO吴泳铭宣布阿里云重磅升级全栈AI体系,实现从AI大模型到AI基础设施的技术更新。面向新一轮智能革命,阿里云将全力打造成为全栈人工智
2025-09-24 13:30:00
昨天凌晨,阿里巴巴又默默干了件大事:发布并开源全新的推理模型通义千问QwQ-32B。千问QwQ-32B是阿里探索推理模型的最新成果
2025-03-07 07:27:00
阿里通义实验室黄斐:开源进入千问时代,即将发布的推理模型会更好用
阿里通义千问已成全球第一大开源模型系列,将“很快”放出基于最新模型Qwen2.5-Max的推理模型。2月21日,全球开发者大会(GDC)在上海开幕,在阿里云魔搭社区主办的论坛上,
2025-02-21 23:22:00
阿里发布全球最强开源模型千问3 通义App第一时间已上线
快科技4月29日消息,阿里新一代通义千问开源模型Qwen3(简称千问3),现已在通义App与通义网页版(tongyi.com)全面上线
2025-04-29 11:35:00
阿里Qwen3登顶全球最强开源模型,用8款模型夺回中国AI话语权
...| 搜狐科技作者 | 梁昌均编辑 | 杨锦一口气开源8款模型,阿里通义又上新!4月29日一大早,阿里开源发布Qwen3
2025-04-29 16:17:00
上线仅7天!阿里通义千问3强势登顶全球开源模型宝座
...日,国际权威大模型测评榜LiveBench公布了最新一期排名,阿里巴巴开源的新一代通义千问模型Qwen3(简称“千问3”)斩获全球开源模型冠军
2025-05-06 16:09:00
吴泳铭官宣3800亿投入后,阿里云如何打AI这场硬仗?
...坚信,2025年一定是中国AI应用爆发的元年。”在4月9日的阿里云AI势能大会上,阿里云智能集团资深副总裁、公共云事业部总裁刘伟光表示。他说这话是有底气的——过去一年,阿里云
2025-04-10 17:12:00
阿里云周靖人回应通义模型“汪峰”梗:某天流量没那么重要
快科技4月29日消息,近日,值此阿里发布全球开源模型千问3 之际,有媒体对话阿里云CTO周靖人。期间,提到阿里云Qwen 在泛商业界相对低调,几次关键发布被 “抢头条”。被开发者
2025-04-29 16:36:00
更多关于科技的资讯:
WowNow即将亮相CES 2026|以AI驱动的柔性制造,探索消费端创意直连制造的新路径
中国创新科技品牌WowNow宣布,将于2026年1月6日至9日亮相在美国拉斯维加斯举办的国际消费电子展(CES 2026)
2026-01-05 11:04:00
国内多筒血拼正酣!海尔三筒洗衣机泰国亮相填补空白
国内三筒洗衣机市场正上演激烈角逐,消费者对分区洗护的需求推动产品快速普及,各大品牌纷纷加码布局,行业竞争持续升级。海尔三筒洗衣机在热销超30万台
2026-01-05 09:52:00
山东移动泰安分公司圆满完成“你好2026”泰山跨年音乐嘉年华通信保障
鲁网1月4日讯2025年12月31日晚,“你好2026”泰山跨年音乐嘉年华在泰安市泰汶吾悦广场西南侧盛大举行,吸引超过两万名乐迷齐聚一堂
2026-01-05 09:55:00
国产新原料赋能产品创新:一支用“牙齿”成分做成的牙膏
近年来,国产科研力量正在持续推动口腔健康科技进步。从材料源头研发到临床研究验证,一系列应用转化研究不仅展示了国产功效型材料的技术潜力
2026-01-05 10:03:00
“手机随时待命、消息秒回”——新兴职业“秒回师”以其即时响应与情感陪伴的特点,吸引了不少年轻人加入。与此同时,代遛宠物专员
2026-01-05 08:36:00
■王哲娟摘要:在数字化与知识经济时代,企业的竞争边界不断扩展,组织间的关系由单向依附转向多层协同。协同创新成为企业嵌入生态系统
2026-01-05 05:42:00
东南网龙岩1月4日讯(通讯员 詹春艳 林培民)近日,龙岩市新罗区10千伏中新线上空,一场静默而精准的“人机协同”带电作业悄然完成
2026-01-04 23:27:00
蔡高民:颠覆认知!打破西方理论垄断!中国老年学自主知识体系诞生
《全生命周期养能力发展与医养结合:理论和实践》的核心突破,在于建构“养”的元概念、定义与内涵外延,并以此为基础构建了逻辑自洽的三大理论体系
2026-01-04 20:15:00
编者按:周期更迭,变量叠加。站在“十五五”开局之年的关键节点上,各行业如何调整节奏、校准路径、寻找增量?中新经纬广邀多领域学者
2026-01-04 20:21:00
春节临近,年味渐浓。在贵阳,一场不同于传统年货市集的新春活动正在酝酿——它以“创意游乐场”为定位,融合在地风物、潮流文化与青年创造力
2026-01-04 21:50:00
不经意晃动手机,软件立即跳转购物页面。最近,记者实测发现,备受诟病的“摇一摇跳转”广告乱象依然时有发生,困扰着不少用户
2026-01-04 17:59:00
2025年度帆书APP经典热搜榜,精准解锁经典中的成长指南
当“信息过载”成为常态,“选择困难”深入骨髓,我们比任何时候都更需要一个清晰的信号:什么才是值得投入时间的真知?近日,帆书APP根据全年用户收听数据发布的“经典热搜榜”
2026-01-04 14:25:00
黄鹤权据光明网报道,英国《剑桥词典》将2025年年度词汇定为“准社交”,形容个体单方面与名人、虚拟角色或聊天机器人产生的密切连接感
2026-01-04 14:25:00
飞晟科技入选海南省儋州市中小企业数字化转型城市试点服务商
近日,海南省儋州市科学技术和工业信息化局对外公示《儋州市中小企业数字化转型城市试点服务商拟纳入名单(第一批)》。公示名单显示
2026-01-04 15:28:00
抖音生活服务联合南京德基广场落地“心动街区”,电视台直播+明星见面会+打卡活动助力商圈消费
12月30日,抖音生活服务“心动街区”活动联合江苏电视台城市频道零距离栏目发起“心动德基24h·南京跨年在德基”美食专场直播
2026-01-04 15:30:00