• 我的订阅
  • 科技

小米开源首个推理大模型Xiaomi MiMo:7B参数就超越OpenAI o1-mini

类别:科技 发布时间:2025-04-30 10:36:00 来源:浅语科技

快科技4月30日消息,小米官方今天正式宣布,开源首个为推理(Reasoning)而生的大模型——Xiaomi MiMo。

据介绍,Xiaomi MiMo在数学推理(AIME 24-25)和代码竞赛(LiveCodeBench v5)公开测评集上,MiMo仅用7B的参数规模,超越了OpenAI的闭源推理模型o1-mini和阿里Qwen更大规模的开源推理模型QwQ-32B-Preview。

小米开源首个推理大模型Xiaomi MiMo:7B参数就超越OpenAI o1-mini

官方表示,MiMo 推理能力的提升,由预训练和后训练阶段中数据和算法等多层面的创新联合驱动。包括:

预训练:核心是让模型见过更多推理模式

数据:着重挖掘富推理语料,并合成约200B tokens推理数据。

训练:进行了三阶段训练,逐步提升训练难度,总训练25T tokens。

小米开源首个推理大模型Xiaomi MiMo:7B参数就超越OpenAI o1-mini

后训练:核心是高效稳定的强化学习算法和框架

算法:提出 Test Difficulty Driven Reward 来缓解困难算法问题中的奖励稀疏问题,并引入 Easy Data Re-Sampling 策略,以稳定 RL 训练。

框架:设计了Seamless Rollout系统,使得RL训练加速2.29倍,验证加速1.96倍。

小米开源首个推理大模型Xiaomi MiMo:7B参数就超越OpenAI o1-mini

所有技术细节已经Open,见技术报告。

MiMo-7B全系列已开源MiMo-7B 已开源4个模型至HuggingFace。

小米开源首个推理大模型Xiaomi MiMo:7B参数就超越OpenAI o1-mini

【本文结束】如需转载请务必注明出处:快科技

责任编辑:建嘉

文章内容举报

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2025-04-30 11:45:07

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

美股异动丨金山云一度涨超13% 小米首个推理大模型MiMo开源
...。金山云H股今日收涨14.2%,报7.4港元。消息面上,今天,小米开源首个为推理(Reasoning)而生的大模型“Xiaomi MiMo”
2025-04-30 23:41:00
面壁智能发布2B模型:适配主流手机,推理成本仅为GPT-4的1/360 | 最前线
...云端协同的部署趋势。自2023年下半年起,三星、华为、小米、特斯拉、理想等国内外手机和智驾厂商都发布了适配于终端硬件的大模型。在终端硬件厂商加速产品AI化的趋势下,面壁智能认
2024-02-03 16:03:00
GPT-4被破解 训练成本 模型架构的秘密都被挖出来了?
...今天我们想分享一下。这包括模型架构、训练基础设施、推理基础设施、参数计数、训练数据集组成、令牌计数、层数、并行策略、多模态视觉适应、不同工程权衡背后的思维过程、独特的实施技术
2023-07-12 20:14:00
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...码仓库 Trending Research 第一位。为了赋予机器人端到端的推理和操纵能力,本文创新性地将视觉编码器与高效的状态空间语言模型集成
2024-06-21 09:52:00
商汤生成式AI业务飙涨256%,成为中国大模型、智算服务市场占有率领头羊
...端设备。商汤的企业客户覆盖各行各业,其中既有京东、小米、金山办公等互联网公司,也包括三大运营商、吉利等车企、以清华为代表的高校、头部大模型创业公司等等。目前共有3000多家行
2024-09-13 13:50:00
第一个100%开源的MoE大模型,7B的参数,1B的推理成本
...语言模型 (LM) 在各种任务上取得了重大进展,但在训练和推理方面,性能和成本之间仍然需要权衡。对于许多学者和开发人员来说,高性能的 LM 是无法访问的,因为它们的构建和部署
2024-09-06 10:01:00
昆仑万维宣布开源2千亿稀疏大模型Skywork-MoE
...万维宣布开源2千亿稀疏大模型Skywork-MoE,性能强劲,同时推理成本更低。Skywork-MoE基于之前昆仑万维开源的Skywork-13B模型中间checkpoint扩展而来
2024-06-03 20:59:00
大模型不会推理,为什么也能有思路?有人把原理搞明白了
大模型不会照搬训练数据中的数学推理,回答事实问题和推理问题的「思路」也不一样。大语言模型的「推理」能力应该不是推理,在今年 6 月
2024-11-23 09:42:00
阿里发布千问3.5,性能媲美Gemini 3, Token价格仅为其1/18
...性能超过万亿参数的Qwen3-Max模型,部署显存占用降低60%,推理效率大幅提升,最大推理吞吐量可提升至19倍。Qwen3
2026-02-16 17:34:00
更多关于科技的资讯:
在声音经济崛起与全民素养提升的浪潮中,越来越多人渴望通过专业训练改善发音、解锁声音价值,梨花声音教育作为十方融海旗下核心品牌
2026-03-12 14:41:00
连接中国读者与世界文化 京东图书携精选书目亮相2026年伦敦书展
3月10日至12日,2026年伦敦书展于奥林匹亚展览中心举行,京东图书携手京东全球售精选优质书目亮相这一全球出版业春季盛会
2026-03-12 15:10:00
宁阳县第一人民医院脑电生物反馈治疗:为大脑做科学的“放松训练”
鲁网3月12日讯在快节奏的现代生活中,人们常常需要同时处理多项任务,承受各种压力,可能会出现注意力不集中、失眠等情况,严重者甚至引发头痛
2026-03-12 15:38:00
“找春天”为主题 CHIC2026(春季)在沪开幕
以“找春天”为主题的CHIC2026(春季)3月11日在沪启幕。作为中国服装产业的风向标与晴雨表,本届展会在117,200㎡展呈空间内
2026-03-12 15:53:00
上饶银行鄱阳支行以“赣质贷”助力科技小微企业跑出创新发展“加速度”
.wordContentCss_17732994133111{ font-family:宋体; font-size:14pt
2026-03-12 16:02:00
它石A1机器人获吉尼斯世界纪录称号,中国具身智能大模型“真落地”
2026年3月12日,随全球科技盛会AWE 2026在上海正式开幕,中国具身智能再度迎来里程碑时刻:由它石智航自主研发的A1机器人成功挑战吉尼斯世界纪录™称号
2026-03-12 16:13:00
连续6年全球家电行业第一!海尔智家再获32项iF设计奖
当下人们对理想居家生活的向往,早已绕不开“无人家务”的省心图景—— 不用为食材过期焦虑,不用为衣物洗护纠结,不用被琐碎家务消耗精力
2026-03-12 16:15:00
芯片初创公司通常面临一个两难困境:要做出产品就需要使用成熟的IP,但IP授权费用对早期团队而言是不小的负担。近日,Arm技术授权订阅模式中的Arm Flexible Access 方案进行了升级调整
2026-03-12 16:15:00
中国石油昆仑数智牵头制定的IEEE标准发布
在中国石油部分加油站,加油机器人已成为智慧加油的新亮点近日,由中国石油昆仑数智牵头制定的IEEE(加油机器人系统通用要求标准)通过IEEE SA标准委员会批准
2026-03-12 16:56:00
中新经纬3月12日电 据韩联社消息,韩国个人信息保护委员会(下称“委员会”)12日表示,对用户个人信息保护不到位造成45万名用户身份证号码泄露的乐天信用卡公司作出行政处罚
2026-03-12 16:56:00
快节奏的时代,每天被拖地、洗衣、做饭缠着晕头转向,什么时候才能跟家务说再见?在即将到来的AWE上,海尔带来全新成果,让无人家务更进一步
2026-03-12 16:14:00
戴着千问AI眼镜上两会,外媒记者:采访更高效了
今年全国两会现场,一款中国AI眼镜成为外媒记者的新宠。来自摩洛哥的中阿卫视记者毕诺,与多位国际同行纷纷戴上千问AI眼镜进行两会报道
2026-03-12 11:37:00
【奋进春天里】冲刺2200亿 2026年贵阳贵安将持续做大数智产业集群
编者按:一年春作首,奋进正当时。三月的黔中大地,生机盎然、干劲冲天,企业车间开足马力忙生产,项目工地塔吊林立赶进度。春日的沃土上
2026-03-12 11:52:00
鲁网3月12日讯3月12日,2026中国家电及消费电子博览会(AWE2026)在上海新国际博览中心正式开幕。继去年首发AI之眼技术
2026-03-12 12:08:00
3月11日,贵州省商务厅启动“2026年贵州食品、日用百货类商品线上促消费活动”,以“平台优惠+折扣立减”的促销方式,面向全国消费者发放总额1000万元的政府补贴
2026-03-12 12:22:00