• 我的订阅
  • 科技

小米开源首个推理大模型Xiaomi MiMo:7B参数就超越OpenAI o1-mini

类别:科技 发布时间:2025-04-30 10:36:00 来源:浅语科技

快科技4月30日消息,小米官方今天正式宣布,开源首个为推理(Reasoning)而生的大模型——Xiaomi MiMo。

据介绍,Xiaomi MiMo在数学推理(AIME 24-25)和代码竞赛(LiveCodeBench v5)公开测评集上,MiMo仅用7B的参数规模,超越了OpenAI的闭源推理模型o1-mini和阿里Qwen更大规模的开源推理模型QwQ-32B-Preview。

小米开源首个推理大模型Xiaomi MiMo:7B参数就超越OpenAI o1-mini

官方表示,MiMo 推理能力的提升,由预训练和后训练阶段中数据和算法等多层面的创新联合驱动。包括:

预训练:核心是让模型见过更多推理模式

数据:着重挖掘富推理语料,并合成约200B tokens推理数据。

训练:进行了三阶段训练,逐步提升训练难度,总训练25T tokens。

小米开源首个推理大模型Xiaomi MiMo:7B参数就超越OpenAI o1-mini

后训练:核心是高效稳定的强化学习算法和框架

算法:提出 Test Difficulty Driven Reward 来缓解困难算法问题中的奖励稀疏问题,并引入 Easy Data Re-Sampling 策略,以稳定 RL 训练。

框架:设计了Seamless Rollout系统,使得RL训练加速2.29倍,验证加速1.96倍。

小米开源首个推理大模型Xiaomi MiMo:7B参数就超越OpenAI o1-mini

所有技术细节已经Open,见技术报告。

MiMo-7B全系列已开源MiMo-7B 已开源4个模型至HuggingFace。

小米开源首个推理大模型Xiaomi MiMo:7B参数就超越OpenAI o1-mini

【本文结束】如需转载请务必注明出处:快科技

责任编辑:建嘉

文章内容举报

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2025-04-30 11:45:07

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

美股异动丨金山云一度涨超13% 小米首个推理大模型MiMo开源
...。金山云H股今日收涨14.2%,报7.4港元。消息面上,今天,小米开源首个为推理(Reasoning)而生的大模型“Xiaomi MiMo”
2025-04-30 23:41:00
面壁智能发布2B模型:适配主流手机,推理成本仅为GPT-4的1/360 | 最前线
...云端协同的部署趋势。自2023年下半年起,三星、华为、小米、特斯拉、理想等国内外手机和智驾厂商都发布了适配于终端硬件的大模型。在终端硬件厂商加速产品AI化的趋势下,面壁智能认
2024-02-03 16:03:00
GPT-4被破解 训练成本 模型架构的秘密都被挖出来了?
...今天我们想分享一下。这包括模型架构、训练基础设施、推理基础设施、参数计数、训练数据集组成、令牌计数、层数、并行策略、多模态视觉适应、不同工程权衡背后的思维过程、独特的实施技术
2023-07-12 20:14:00
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...码仓库 Trending Research 第一位。为了赋予机器人端到端的推理和操纵能力,本文创新性地将视觉编码器与高效的状态空间语言模型集成
2024-06-21 09:52:00
商汤生成式AI业务飙涨256%,成为中国大模型、智算服务市场占有率领头羊
...端设备。商汤的企业客户覆盖各行各业,其中既有京东、小米、金山办公等互联网公司,也包括三大运营商、吉利等车企、以清华为代表的高校、头部大模型创业公司等等。目前共有3000多家行
2024-09-13 13:50:00
第一个100%开源的MoE大模型,7B的参数,1B的推理成本
...语言模型 (LM) 在各种任务上取得了重大进展,但在训练和推理方面,性能和成本之间仍然需要权衡。对于许多学者和开发人员来说,高性能的 LM 是无法访问的,因为它们的构建和部署
2024-09-06 10:01:00
昆仑万维宣布开源2千亿稀疏大模型Skywork-MoE
...万维宣布开源2千亿稀疏大模型Skywork-MoE,性能强劲,同时推理成本更低。Skywork-MoE基于之前昆仑万维开源的Skywork-13B模型中间checkpoint扩展而来
2024-06-03 20:59:00
大模型不会推理,为什么也能有思路?有人把原理搞明白了
大模型不会照搬训练数据中的数学推理,回答事实问题和推理问题的「思路」也不一样。大语言模型的「推理」能力应该不是推理,在今年 6 月
2024-11-23 09:42:00
鄂维南院士领衔新作:大模型不止有RAG、参数存储,还有第3种记忆
...凡的性能而获得了前所未有的关注。然而, LLM 的训练和推理成本高昂,人们一直在尝试通过各种优化方法来降低成本。本文来自上海算法创新研究院、北京大学等机构的研究者受人类大脑记
2024-07-11 09:33:00
更多关于科技的资讯:
天津市优秀基层理论宣讲员风采展示
2025-12-24 17:48:00
天津市优秀基层理论宣讲员风采展示
2025-12-24 17:49:00
2025长三角伴手礼名单揭晓,有道词典笔行业独家上榜
日前,长三角消保委联盟举办“2025长三角伴手礼”评测活动,经过专业测评优中择优,为消费者推荐各行各业的优质品牌和放心产品
2025-12-24 18:37:00
2025年最省电的空调推荐?跟着趋势选,节能与舒适一站到位!
随着绿色家居理念深入人心,2025年家电消费市场的“节能属性”愈发凸显,空调作为居家高频耗电大户,“省电能力”已成为消费者选购时的核心考量
2025-12-24 22:03:00
科技攻“尖”产业向“新”,盈康一生打造医工创新策源地
近日,“AI for Health助力健康中国2030——第二届海医汇医疗科技创新生态大会”在北京隆重举行。作为海尔集团旗下大健康生态品牌
2025-12-24 22:04:00
中国蓝新闻讯 随着全球多地气温骤降,“取暖需求”持续升温。作为全球小商品贸易的风向标,义乌市场早已嗅到商机,各类取暖、保暖设备进入产销旺季
2025-12-24 16:53:00
鲁网12月24日讯近期,工行临沂兰山批发城支行为全面贯彻国家关于深化普惠金融服务、支持实体经济发展的战略方针,积极响应金融监管机构关于加大普惠金融力度的政策导向
2025-12-24 14:44:00
《次第花开》首期圆满落幕,女性成长新时代启航
近日,她创美好赋能学园首期传承营——《次第花开》在学员的满载收获中圆满落幕。本次课程汇聚了来自各行业的优秀女性,通过为期三天的系统学习
2025-12-24 11:31:00
千企齐聚利雅得,深度链接沙特“2030愿景”---- 2025沙特中国出口品牌联展启幕
12月22日,2025沙特中国出口品牌联展(以下简称“沙特联展”)在沙特利雅得前沿会展中心开幕。作为首次落地沙特的中国出口品牌系列展
2025-12-24 11:34:00
凭何赢得央视频认可? 成都普济中医以专业实力诠释“身边的肿瘤康复专家”
在国家“健康中国”战略深入推进的背景下,树立医疗健康领域的优质标杆,传播科学、规范的实践模式,已成为推动行业高质量发展的重要途径
2025-12-24 11:44:00
大皖新闻讯 近日,安徽敏航科技有限公司与北京魔康科技发展有限公司进行“数智赋能·空域共生”无人机战略合作签约,双方建立全面战略合作伙伴关系
2025-12-24 12:32:00
数据驱动的仓储革命:中感智能清仓机器人如何成为企业积累工艺数据资产的关键
当前,全球工业领域正加速向智能化、无人化转型,国家政策亦持续鼓励“机械化换人、自动化减人、智能化无人”,以提升本质安全水平与生产效率
2025-12-24 10:31:00
中新经纬12月24日电 针对法国仓遭遇盗抢事件,京东回应中新经纬称,北京时间12月22日,位于法国巴黎地区的京东仓储遭遇盗抢
2025-12-24 10:32:00
厦门网讯(厦门日报记者 楚燕 通讯员 陈雯 李欣)在患者脑中植入电极片,设备就能实时解码患者意图,通过穿戴式设备帮助患者实现抬手
2025-12-24 08:04:00
太晓红摘要:金融科技的崛起对传统商业银行的经营影响极为深远,通过重塑其成本结构、拓展收入边界、优化资产质量,显著提升了传统商业银行的盈利能力
2025-12-24 06:39:00