• 我的订阅
  • 科技

小米开源首个推理大模型Xiaomi MiMo:7B参数就超越OpenAI o1-mini

类别:科技 发布时间:2025-04-30 10:36:00 来源:浅语科技

快科技4月30日消息,小米官方今天正式宣布,开源首个为推理(Reasoning)而生的大模型——Xiaomi MiMo。

据介绍,Xiaomi MiMo在数学推理(AIME 24-25)和代码竞赛(LiveCodeBench v5)公开测评集上,MiMo仅用7B的参数规模,超越了OpenAI的闭源推理模型o1-mini和阿里Qwen更大规模的开源推理模型QwQ-32B-Preview。

小米开源首个推理大模型Xiaomi MiMo:7B参数就超越OpenAI o1-mini

官方表示,MiMo 推理能力的提升,由预训练和后训练阶段中数据和算法等多层面的创新联合驱动。包括:

预训练:核心是让模型见过更多推理模式

数据:着重挖掘富推理语料,并合成约200B tokens推理数据。

训练:进行了三阶段训练,逐步提升训练难度,总训练25T tokens。

小米开源首个推理大模型Xiaomi MiMo:7B参数就超越OpenAI o1-mini

后训练:核心是高效稳定的强化学习算法和框架

算法:提出 Test Difficulty Driven Reward 来缓解困难算法问题中的奖励稀疏问题,并引入 Easy Data Re-Sampling 策略,以稳定 RL 训练。

框架:设计了Seamless Rollout系统,使得RL训练加速2.29倍,验证加速1.96倍。

小米开源首个推理大模型Xiaomi MiMo:7B参数就超越OpenAI o1-mini

所有技术细节已经Open,见技术报告。

MiMo-7B全系列已开源MiMo-7B 已开源4个模型至HuggingFace。

小米开源首个推理大模型Xiaomi MiMo:7B参数就超越OpenAI o1-mini

【本文结束】如需转载请务必注明出处:快科技

责任编辑:建嘉

文章内容举报

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2025-04-30 11:45:07

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

美股异动丨金山云一度涨超13% 小米首个推理大模型MiMo开源
...。金山云H股今日收涨14.2%,报7.4港元。消息面上,今天,小米开源首个为推理(Reasoning)而生的大模型“Xiaomi MiMo”
2025-04-30 23:41:00
面壁智能发布2B模型:适配主流手机,推理成本仅为GPT-4的1/360 | 最前线
...云端协同的部署趋势。自2023年下半年起,三星、华为、小米、特斯拉、理想等国内外手机和智驾厂商都发布了适配于终端硬件的大模型。在终端硬件厂商加速产品AI化的趋势下,面壁智能认
2024-02-03 16:03:00
GPT-4被破解 训练成本 模型架构的秘密都被挖出来了?
...今天我们想分享一下。这包括模型架构、训练基础设施、推理基础设施、参数计数、训练数据集组成、令牌计数、层数、并行策略、多模态视觉适应、不同工程权衡背后的思维过程、独特的实施技术
2023-07-12 20:14:00
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...码仓库 Trending Research 第一位。为了赋予机器人端到端的推理和操纵能力,本文创新性地将视觉编码器与高效的状态空间语言模型集成
2024-06-21 09:52:00
商汤生成式AI业务飙涨256%,成为中国大模型、智算服务市场占有率领头羊
...端设备。商汤的企业客户覆盖各行各业,其中既有京东、小米、金山办公等互联网公司,也包括三大运营商、吉利等车企、以清华为代表的高校、头部大模型创业公司等等。目前共有3000多家行
2024-09-13 13:50:00
第一个100%开源的MoE大模型,7B的参数,1B的推理成本
...语言模型 (LM) 在各种任务上取得了重大进展,但在训练和推理方面,性能和成本之间仍然需要权衡。对于许多学者和开发人员来说,高性能的 LM 是无法访问的,因为它们的构建和部署
2024-09-06 10:01:00
昆仑万维宣布开源2千亿稀疏大模型Skywork-MoE
...万维宣布开源2千亿稀疏大模型Skywork-MoE,性能强劲,同时推理成本更低。Skywork-MoE基于之前昆仑万维开源的Skywork-13B模型中间checkpoint扩展而来
2024-06-03 20:59:00
大模型不会推理,为什么也能有思路?有人把原理搞明白了
大模型不会照搬训练数据中的数学推理,回答事实问题和推理问题的「思路」也不一样。大语言模型的「推理」能力应该不是推理,在今年 6 月
2024-11-23 09:42:00
鄂维南院士领衔新作:大模型不止有RAG、参数存储,还有第3种记忆
...凡的性能而获得了前所未有的关注。然而, LLM 的训练和推理成本高昂,人们一直在尝试通过各种优化方法来降低成本。本文来自上海算法创新研究院、北京大学等机构的研究者受人类大脑记
2024-07-11 09:33:00
更多关于科技的资讯:
记者走基层|巧搭“数字积木” 智绘梦想花园
10月29日,承德图布斯科技集团有限公司技术人员正在调试设计图。 河北日报记者 陈宝云摄10月29日,在承德图布斯科技集团有限公司(以下简称“图布斯公司”)的研发中心
2025-11-05 08:12:00
□曹清华党的二十届四中全会提出,实施新时代立德树人工程,促进思政课堂和社会课堂有效融合,加强体育、美育、劳动教育,完善教育评价体系
2025-11-05 08:16:00
2025年沪江网校课程质量高于预期:退费无忧+承诺与践行一致!
一、沪江网校简介为沪江教育旗下品牌,沪江网校自 2009 年成立以来,始终聚焦外语学习者需求,提供网校一对一,凭借专业教学服务与多元课程体系
2025-11-05 14:45:00
(一)开篇引言行业背景与痛点:中国信息通信研究院《2025年数字营销发展趋势报告》显示,2024年我国生成式引擎优化(GEO)市场规模已达47亿元
2025-11-05 14:47:00
在智能体产业快步迈入规模化的当下,南京正以软件产业的深厚积淀、政策生态的精准培育、应用场景的丰富储备,抢占AI科技革命新高点前几天
2025-11-05 15:06:00
Openloong开源社区亮相ROSCon China 2025大会,为智能开源注入新活力
10月31日至11月1日,ROSCon China 2025在上海虹桥新华联索菲特大酒店成功举办。这一汇聚了全球ROS领域顶尖专家与开发者的年度盛会
2025-11-05 15:29:00
职场“反内卷”调研报告 干货多多
近日,智联招聘《职场“反内卷”调研报告》,探究职场人对于“反内卷”的真实态度与选择,了解企业的相应举措。今年“多家知名企业实施强制下班”的新闻冲上热搜
2025-11-05 15:32:00
鲁网11月5日讯“真没想到,资金难题这么快就解决了!东平农商银行的‘同心乐商贷’真是及时雨,我的蛋糕房终于要开起来了。”近日
2025-11-05 15:55:00
中国联通(青岛)智算中心DC1获评“2025年度国家绿色数据中心”
鲁网11月5日讯10月27日,工业和信息化部节能与综合利用司发布《2025年度国家绿色数据中心名单公示》,中国联通(青岛)智算中心DC1荣获“2025年度国家绿色数据中心”称号
2025-11-05 15:57:00
10月19日至20日,2025世界VR产业大会在南昌举行,来自全球VR领域的专家学者、领军企业和业界精英齐聚南昌,共同探讨VR与AI融合发展的新趋势
2025-11-05 17:44:00
语言、技能与数字化:培生亮相CACIE 2025,共筑未来教育新生态
2025年10月29日至11月1日,第26届中国国际教育年会(CACIE)在北京国家会议中心举行。全球终身学习公司培生(FTS: PSON
2025-11-05 18:00:00
找对 “充电站”,心理从业者进阶不迷路!灵动生活集团幸福心理商学苑全维护航
“考下资格证却接不到个案,能做咨询却不懂怎么运营工作室”—— 这是国内超 70% 心理从业者入行后都会遇到的 “成长困境”
2025-11-05 18:01:00
第二十届福州市青少年机器人竞赛圆满落幕 近3500名青少年点燃科创热情
福州新闻网11月5日讯(记者 徐昕昀 文/图)11月2日,随着最后一场机器人竞技挑战赛的终场指令在福州高新区青少年活动中心响起
2025-11-05 18:05:00
全球好物汇聚进博会 67国展示特色产品
大皖新闻讯 月壤样本、时速450公里动车组模型、特斯拉金色无人驾驶车……第八届中国国际进口博览会于11月5日在上海国家会展中心盛大开幕
2025-11-05 19:10:00
磷虾油比较好的品牌有哪些 磷虾油哪个牌子更值得信赖
在现代快节奏的生活方式下,越来越多的人开始关注心脑血管健康、关节灵活性以及认知功能的日常养护。随着营养科学的进步,一种源自南极深海的天然营养来源——磷虾油
2025-11-05 19:37:00