我的订阅
科技

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

哪里不会扫哪里！全球最强数学大模型在线玩，阿里多模态模型加持

类别：科技发布时间：2024-08-21 09:42:00 来源：量子位

现在，最强数学大模型，人人都可上手玩了！

一觉醒来，阿里千问大模型团队发布了Qwen2-Math的Demo，抱抱脸在线可玩。

惊喜的是，如果嫌输入数学公式比较麻烦，可以把想问的题截图or扫描，上传即可解题。

整得挺方便。

试玩界面上明确写着，“这个试玩界面的OCR功能，由阿里千问大模型团队Qwen2-VL提供支持；数学推理能力，由Qwen2-Math支持。”

阿里高级算法专家林俊旸也在推特评论区进一步解释：

目前，Qwen2-VL和Qwen2-Math还是各自负责一部分。但不久的将来，我们会把多模态能力和数学推理能力结合到一个模型上哟。

不少网友对这种交互模式挺买账：

歪瑞古德！用图像来上传，然后等大模型解决问题，喜欢！

那么，最强数学大模型Qwen2-Math，上手效果怎么样？

效果怎么样？这就玩一把

是时候让Qwen2-Math过五关斩六将了！

先来几道比较简单的计算题开开胃。

提前说明，两位体验过程中，Qwen2-Math不是一边算一边显示的，而是计算完毕后直接显示过程和结果。

（而且应该是越来越多人开始玩了，结果生成时间逐渐拉长）

第一题：“计算AxA+A=240”中，A的值。

Qwen2-Math给出了正确答案，A=14或A=-16。

第二题：给定a的值，计算等式的结果。

Qwen2-Math计算出，答案是0，也是对的。

第三题：（A+3）（A+4）（A+5）=120，求A的值。

Bingo！答案是1。

OK，热身结束，给Qwen2-Math点难度看看。

那就来一道已经是（数学）大模型测评的标配：

9.9和9.11哪个更大？

Qwen2-Math自信回答：

9.9比9.11更大！

那就再上点难度！

扔给它一道截至目前，只有GPT-4o答对过的题：

一个外星人来到地球后等可能选择以下四件事中的一件完成：1、自我毁灭；2、分裂成两个外星人；3、分裂成三个外星人；4、什么都不做。此后每天，每个外星人均会做一次选择，且彼此之间相互独立。求地球上最终没有外星人的概率。

这道题，Qwen2-Math花费了约30秒左右的时间，给出答案：1。

很遗憾，答案是错误的，正确答案是√2减1。

我们在各大平台的评论区逛了一下，除了计算错误以外，还有另一种可能导致答案不正确——

那就是Qwen2-VL在识别题目的时候，本身就出错了。

错在第一步，这样的话大模型得出的肯定就不是正确答案。

同时，林俊旸还在网友的评论区表示：

咱们Qwen2-Math目前还不能做几何题。

用中文提问也可以

这次的主角Qwen2-Math，基于通义千问开源大语言模型Qwen2研发，由阿里千问大模型团队在十天前发布。

它专用于数学解题，并且能够解决竞赛级试题。

Qwen2-Math总共有三个参数量的版本：

72B，7B和1.5B。

在Qwen2-Math-72B的基础之上，千问团队还微调出了Instruct版本。

这也是Qwen2-Math的旗舰模型，它是一个数学专用的奖励模型，将奖励信号与正误判断信号结合作为学习标签，再通过拒绝采样构建监督微调（SFT）数据，最后在SFT模型基础上使用GRPO方法优化。

Qwen2-Math-72B-Instruct以84%的准确率处理了代数、几何、计数与概率、数论等多种数学问题。

并且一经发布就在数学大模型中“登基”，在MATH数据集上比GPT-4o多得了7分，按比例算高出了9.6%。

直接超越开源Llama 3.1-405B以及闭源的GPT-4o、Claude 3.5等。

截至发稿，抱抱脸上Qwen2-Math-72B-Instruct的下载量超过了13.2k。

而且有个最新发现：

虽然团队声称Qwen2-Math目前还是主要针对英文场景，但如果拿中文题目去问它，Qwen2-Math还是能进行解答的。

只不过是用英文回答你罢了。

据了解，Qwen2-Math的中英双语版本将会在之后推出。

以上内容为资讯信息快照，由td.fyun.cc爬虫进行采集并收录，本站未对信息做任何修改，信息内容不代表本站立场。

快照生成时间：2024-08-21 11:45:06

本站信息快照查询为非营利公共服务，如有侵权请联系我们进行删除。

信息原文地址：

更多关于模型,模态,阿里,数学,全球,在线的资讯：

阿里国际发布最新开源多模态模型Ovis，多模态能力再升级

...力再次升级！今天，阿里国际AI团队发布了一款多模态大模型Ovis，在图像理解任务上不断突破极限，多种具体的子类任务中均达到了SOTA（最新技术）水平。多模态大模型能够处理和理

2024-09-20 13:35:00

全球顶尖人工智能科学家加盟阿里AI To C业务布局再提速

...集团副总裁，向吴嘉汇报，负责AI To C业务的多模态基础模型及Agents相关基础研究与应用解决方案。近期，阿里AI To C业务大动作频频

2025-02-08 18:48:00

阿里云重磅升级全栈AI体系，一文看懂云栖大会技术发布

...团CEO吴泳铭宣布阿里云重磅升级全栈AI体系，实现从AI大模型到AI基础设施的技术更新。面向新一轮智能革命，阿里云将全力打造成为全栈人工智能服务商。AI时代，大模型将是下一代

2025-09-24 13:30:00

阿里Qwen3登顶全球最强开源模型，用8款模型夺回中国AI话

出品 | 搜狐科技作者 | 梁昌均编辑 | 杨锦一口气开源8款模型，阿里通义又上新！4月29日一大早，阿里开源发布Qwen3

2025-04-29 16:17:00

李开复AI公司首发大模型，阿里云领投 | 36氪独家

...复成立的AI公司“零一万物”发布了首款开源中英双语大模型“Yi”。与此同时，36氪获悉，零一万物已完成新一轮融资，由阿里云领投

2023-11-06 12:13:00

2024阿里巴巴全球数学竞赛开考 563支AI队伍与人类挑战

...院所与企业的563支队伍使用AI作答。他们各显神通，使用模型调优、AI Agent、提示词工程等多种方式，推动AI构建更强大的数学能力

2024-04-15 14:08:00

通义千问再放大招：720亿大模型开源，全尺寸赶上LLaMA-

...包括编程、AI阅读、音视频转录、AI角色生成等八大产品模型。当时，阿里云就已经预告，接下来还要再发更大规模的开源模型

2023-12-01 21:07:00

杭州科技企业为何集体押注大模型开源？

霸榜全球开源模型前三杭州日报讯 4月2日，全球AI开源圈炸锅了——杭州的3个大模型直接包揽Hugging Face榜单前三

2025-04-03 06:49:00

这周，5家公司发了AI新品 | 最前线

...PUS、出门问问5家公司发布了AI相关的新品。但与月余前大模型扎堆发布的态势不同，5家企业的AI新品涵盖了算力层、模型层和应用层——业务的分化或许释放出了乐观的信号：中国的A

2023-04-22 15:32:00

更多关于科技的资讯：

稳就业稳企业稳市场稳预期|从 “设备制造” 到 “全链

9月29日，由陕西省委宣传部举办的“稳就业、稳企业、稳市场、稳预期”主题媒体行活动，带领陕西多家主流媒体走进陕西电子陕西长岭电气有限责任公司参观考察

2025-10-08 17:51:00

华远陆港入选全国“5A级供应链服务企业”

近日，中国物流与采购联合会公布全国第十批5A级供应链服务企业名单，华远国际陆港集团正式通过评审，获评“5A级供应链服务企业”

2025-10-08 18:01:00

中秋国庆假期太原重点商企“揽金”增超一成

货丰价稳、活动密集、销售井喷、消费升级……在这个中秋国庆假期，我市消费市场“热”力值拉满，处处繁荣兴旺、活力十足。10月8日

2025-10-08 18:32:00

抢占新赛道，270多名员工假期忙“冲刺”

佳盛机电乘风而上，今年前8月产值同比增长超38%抢占新赛道，270多名员工假期忙“冲刺”南报网讯（通讯员单维亮记者张希）“我们是智能电网产业链条上的配套企业

2025-10-07 08:41:00

培育壮大十大千亿级产业集群丨十堰臻融：创新与技改“双轮”驱动

十堰广电讯（全媒体记者何旭通讯员胡新）科技创新是提升核心竞争力关键。十堰臻融汽车科技有限公司以智能化装备升级与专利技术研发为双引擎

2025-10-07 20:43:00

沉浸式AR科技盛宴：打造“可触摸”的科普实验室，重构科普新形

这个国庆去哪玩？中国科学技术馆告诉你！2025年10月1日——10月7日由中国科学技术馆、北京峰火文化科技有限公司、Rokid联合打造的以“探境・AR科技智慧”为主题的AR体验活动正火热开展中

2025-10-07 09:05:00

2025年全国大学生计算机大赛总决赛落幕西工大获奖数量质量

近日，2025年全国大学生计算机系统能力大赛各赛道总决赛圆满落幕。本届大赛吸引了来自清华大学、北京大学、复旦大学、华中科技大学

2025-10-07 11:40:00

太划算！遵义多重补贴点燃消费热情

多彩贵州网讯国庆中秋“双节”同至，遵义市推出的“悦·遵义‘双节’欢乐购”促消费活动覆盖整个长假，其中“焕新过节·乐享生活”家电家居促销活动形式丰富

2025-10-07 14:51:00

创新南京，何以攀过一峰又一峰？

□南京日报/紫金山新闻记者张安琪9月23日，2025南京金秋经贸洽谈会开幕式上，一批全球首个、国内首批、性能全球最高的科技成果密集亮相

2025-10-06 09:49:00

“四位一体”综合补能护航高速绿色出行

国庆中秋长假期间，新能源汽车已成为众多家庭出游的重要选择。为进一步破解高速服务区“充电难、排队久”的现实困境，山西交控集团坚持“科技创新+服务升级”双轮驱动

2025-10-06 18:01:00

邮储信用卡气球雨惊喜派对即将空降青岛李沧万达，国庆中秋邀您共

鲁网9月30日讯2025年国庆、中秋双节同庆之际，为回馈广大市民与持卡人长期以来的支持，邮储银行青岛分行将于10月1日-8日

2025-10-06 14:11:00

这群年轻人带货“赢麻”了

□南京日报/紫金山新闻记者于洁尘通讯员陈天骄“干我们这行的，哪有节假日？越是假期越要忙。”10月5日一大早，28岁的陈潇离开南京

2025-10-06 09:48:00

节日我在岗丨十堰高周波：抓创新赶订单全力冲刺年度目标

十堰广电讯（全媒体记者陈林）在国庆中秋假期，位于十堰经济开发区的十堰高周波科工贸有限公司抓创新赶订单，全力冲刺年度目标

2025-10-05 20:21:00

节日我在岗丨艾斯卓智能科技：节日不休赶制订单

十堰广电讯（全媒体记者耿吉国）放假不放松，生产不停工。国庆中秋长假，我市各生产企业铆足干劲抓生产、赶订单，奋力冲刺年度目标任务

2025-10-05 20:21:00

“铁疙瘩”怎样变成“金娃娃”（十）｜一块宽厚板的靶向发力

普阳钢铁工程机械用高强高韧宽厚板全国市场占有率名列前茅一块宽厚板的靶向发力——“铁疙瘩”怎样变成“金娃娃”（十）从矿山到港口

2025-10-05 07:47:00

头条订阅服务

哪里不会扫哪里！全球最强数学大模型在线玩，阿里多模态模型加持