• 我的订阅
  • 科技

MiniMax进化论:一群「偏执者」的破浪前行

类别:科技 发布时间:2025-07-02 13:31:00 来源:36氪
MiniMax进化论:一群「偏执者」的破浪前行

全球开源前二,来自中国大模型的Aha时刻。

如果一个技术用3年时间,从默默无闻到改变世界,我们称其为第N次工业革命;

如果这个技术从论文到落地的过程中,头部玩家如走马灯更迭,百亿流量砸下去只听一声响就陷入沉寂,我们称其为资本绞肉机;

如果这个技术集齐了以上所有特质,还能以常规技术乘十的速度进化,让互联网时代的生态护城河、资金壁垒、规模效应全部失效,创业公司也能站在世界舞台中心,那么,它是大模型。

而这一趋势,自今年年初DeepSeek“掀桌”以来,变得尤为明显。时至今日,在大模型行业,能留在桌子上的企业唯一的生存法则就是——创新至上。

那么,如何理解大模型行业的创新至上?为什么传统互联网的玩法在大模型时代会彻底失效?为什么大模型的淘汰,能以季度为单位发生?

刚刚结束的MiniMax Week,或许正是我们审视这些问题的最佳切入点。

以此为切口,你会看见一个创新行业的创业公司如何挣脱巨头的射程;可以看到大模型从技术创新到改变世界之间的桥梁如何搭建;以及,一群“偏执”的人,如何在这个一切被按下加速键的行业中破浪前行。

一只跳水猫咪,如何让世界Aha

一开始,MiniMax Week的关注度,还局限在大模型行业内的讨论:这次MiniMax会拿到多少SOTA(State of the Art)成绩。

直到全球社交网站上,橘猫、奶牛、三花,各式各样的猫咪跳水视频开始像病毒一样蔓延;紧随其后,羊驼、熊猫、长颈鹿,也在视频中以空中3周半回旋、后空翻等姿势从十米高台一跃而下。甚至,在视频中,你还会看到不同体重的动物起跳时,会对应不同的跳板的震动幅度与水花大小差异。

就像年初的DeepSeek R1发布一样,MiniMax迎来了自己的“Aha时刻”。

“Aha Moment”源自心理学与产品设计领域,指的是用户在使用一个产品或工具时,突然意识到其价值和潜力的那个瞬间。它往往伴随着一种顿悟、惊喜或认知飞跃的感觉。

在其背后,往往是技术发展从量变到质变的关键突破;紧随其后,则往往是产品渗透率大突破,以及行业大规模爆发转折节点的到来。

而猫咪跳水,之所以被称为视频AI的Aha Moment,除了其在社媒上引发的轰动之外,更在于长久以来,跳水、体操、多人交互这样的复杂动作,长期以来一直被视为视频AI的“图灵测试”。

因为这些动作不仅要求AI精确控制每一帧画面,同时,所有连续帧组成的运动时空轨迹如姿势变化、跳跃旋转角度、速度等细节必须符合现实的重力、惯性等物理规律;甚至,不同动物起跳对应的跳板振幅与不同入水姿势带来的水花角度等复杂环境交互,也必须精准还原现实。

而这一切的背后,正是因为MiniMax最新发布的视频模型——Hailuo 02。

纵向对比,Hailuo 02模型参数相较Hailuo 01增长3倍,视频分辨率提升至原生1080P,能实现单次生成10秒的高清内容,涵盖精细肢体动作、流体动力学模拟、镜面效果与真实物理交互,甚至可还原杂技演出级别的复杂动态,并给出专业级的原生运镜。

海螺AI超级创作者:胡生AIGC生成的demo

横向对比,Hailuo 02在Artificial Analysis Video Arena的Image-to-Video榜单中,位列全球第二。与此同时,Hailuo 02在性能超过Google Veo3的情况下,其API成本却只有Google Veo3的1/9。

MiniMax进化论:一群「偏执者」的破浪前行

排名数据始于上榜日,截至目前

那么,为什么Hailuo 02能在保持高逼真度的同时,还能保持低成本?

一方面是scaling law的助推:Hailuo 02模型的总参数量相较于Hailuo 01扩大了3倍,数据量扩大了4倍,使得模型能够理解更加复杂的指令和物理场景。

与此同时,Hailuo 02还采用了创新的NCR(Noise-aware Compute Redistribution)架构。这一架构通过噪声感知机制,将计算资源按照需求分配给不同的区域。高噪声区域的信息密度较低,进行压缩处理;低噪声区域则分配更多的计算资源,重点捕捉关键细节,进而有效减少HBM内存读写量逾70%,让训练与推理效率提升2.5倍。

当然,这种将精力放在对的事情上、不断创新的逻辑,不只是NCR的底层技术思路,同时也是对MiniMax企业气质,以及如今地位如何炼成的最好概括。

M1创新背后:大模型如何挣脱巨头的资本万有引力

去年的同一时间,让无数大模型创业者们最头疼的问题之一,一定包括:

巨头的每一次转身,都是中小企业的生死考验。那么你如何逃脱巨头的资本万有引力?

不仅合作伙伴关心,但凡公开场合,媒体、投资人也一定会反复追问。

形势看起来的确严峻:国内外几乎所有互联网巨头、科技巨头全数下场大模型,百模大战之激烈,一度让人以为要复刻当年共享单车、外卖的老路。

质疑的原因似乎也讲得通:大模型参数已经走到万亿关口,无论训练还是推理都需要足够的资本壁垒;大模型进化需要依赖海量数据,而巨头恰好有足够的数据资源;大模型研发需要高密度的人才,大厂的优渥资源,看似也足以支撑其挖来任何想要的人才。

但现实却是:仅仅一年时间过去,百模大战便进入偃旗息鼓阶段;各种榜单的SOTA也被Open AI、Anthropic、MiniMax、DeepSeek这样的创业公司占据了大半。

逻辑很简单,大量的资本投入,只是模型训练的条件之一。但做大模型如投资,一个技术路线越是共识程度高,就越说明这已经是个滞后变量,企业必须不断挖掘新的有效的Alpha,才能带来超额的回报。而在这一方面,更加灵活的创业公司,相比传统巨头,往往有着更加敏锐的嗅觉与更高效的决策链条。

具体到MiniMax,市场层面,仅去年前8个月,其海外产品Talkie的全球下载量就快速突破千万次,超过Character AI,成为美国市场下载量第4的人工智能应用。英国《金融时报》报道称,MiniMax2024年的营收,在7000万美元左右。

技术层面,刚刚在专业大模型基准测试 Artificial Analysis 榜单中拿下全球前二成绩的MiniMax M1模型同样是很好的例证。这是一个拥有4560亿参数的大模型,除了在业内主流的 17 个评测集位列前茅之外,M1还是全球上下文最长的推理模型,原生支持100万token输入长度,是DeepSeek R1的8倍;并且支持8万个输出token,打破了Gemini 2.5 Pro的6.4万个限制,成为世界最长输出的模型。

MiniMax进化论:一群「偏执者」的破浪前行

对大模型而言,更长的上下文,往往意味着更强的智能体验。尤其是在深度搜索、科研等高复杂度场景中,长上下文更是深度推理(数学题、代码场景)、深度内容综合(论文创作、行业研究)的核心能力来源。尤其在agent场景中,随着多agent混合成为新的行业趋势,各个子agent的输出结果,会变成输入给到主agent,如果上下文长度不够,那么整个系统都会随之变得毫无意义。

与此同时,在工具使用场景(TAU-bench)中,MiniMax-M1-40k更是领跑所有开源权重模型,甚至超过闭源模型Gemini-2.5 Pro。数据显示,即使在30多轮长链路思考与工具调用任务中,MiniMax-M1-40k依然有极高的稳定性。

MiniMax进化论:一群「偏执者」的破浪前行

那么问题来了,既然创新是大模型时代通往终点的路径,支撑起M1如此成绩的核心创新究竟是什么?

答案一是M1在架构上的创新。

与业内常规做法一样,M1也是在预训练的基座模型(MiniMax-Text-01)上进行强化学习后构建而成,同样采用了混合专家结构(MoE)。但鲜少有人知道,早在2023年前后,MoE尚未成为行业共识的时候,MiniMax就已经推出了国内首个MoE大模型。

也是在同一时期,在同行还普遍采用传统Transformer的自注意力计算机制时,MiniMax就已经开启了对混合注意力机制的探索,并在其后将这一技术用于M1模型。所谓混合注意力机制,就是1/8使用自注意力机制,另外7/8使用了自创的Lightning Attention(线性注意力),通过先做“分块计算”(tiling),块内用传统注意力计算,块间采用线性注意力进行信息传递,最终完成全局语义捕捉的方式,避免了累积求和操作(cumsum)拖慢速度。这也是更长上下文窗口的底层技术支撑。

除了架构的创新,在训练方法上,MiniMax M1还采用CISPO(Clipped IS-weight Policy Optimization)替代传统的PPO(近端策略优化)/GRPO(deepseek开发的近端策略优化),极大压缩成本,提升训练效率。

传统的PPO/GRPO算法在处理混合架构时会直接忽略However、Wait、Aha之类的重要性很高但是频率较低的token,或者只给他们很低的权重。导致模型的复杂推理出现逻辑混乱等问题。而MiniMax的CISPO算法,会根据token的重要性对其进行采样、裁剪,赋予权重,让长响应除了长度之外,更有质量。

MiniMax进化论:一群「偏执者」的破浪前行

技术报告显示,基于CISPO,训练侧,MiniMax团队只用了3周时间、512块H800 GPU就完成强化学习训练阶段,算力租用成本仅53万美元。即使相比最新的DAPO,也能仅用一半的训练步数达到相同的性能。

推理侧,生成10万token时,M1的推理算力也只需要DeepSeek R1的25%,而且M1模型在数学和编程等任务上比DeepSeek-R1模型还要高效。

也就是说,对MiniMax而言,大模型的确是个烧钱的事业,但只要一脚迈过门槛,产业真正比拼的还是谁更能通过技术创新省钱,让技术更加普惠,且带来更高的上限。

Agent,技术到商业的桥梁如何打造?

事实上,如果将目光拉长到最近十年,会发现,这已经是第二次AI浪潮,上一波以AlexNet+Alpha Go点燃的AI大爆发中,AI的落地始终没有逃出视觉识别、NLP的范畴,最终陷入短暂低谷。

但大模型不同,其通用能力带来了更高的商业化天花板,也让技术的生命周期,被无限拉长。

最近两年,行业的Aha时刻,大致可以分为两种类型。一种是底层大模型的能力技术创新:比如一开始的ChatGPT,比如年初的DeepSeek。

而在大模型创新基础之上,是另一种横向的Agent应用创新,其典型代表比如cursor、lovart、manus。

因为Agent的优势之一,就是可以通过多步操作集成达成更直观可用的结果。而一个惊艳的成果展示,往往就是一个技术从实验室到产业加速的重要转折点,这次出圈的Hailuo Video Agent也如此。

比起一般的视频生成,Hailuo Agent操作更简单,同时效果更可控,可以一键生成全片。不只是小猫跳水,羊驼跳水,甚至复杂体操动作,Hailuo Video Agent都能搞定。目前阶段Hailuo Video Agent已经支持超百种视频模板,涵盖艺术片、广告片、MV、社媒爆款等多种体裁。这也意味着AI彻底打通了创意构思、分镜设计、图片素材生成、剪辑完整视频的生产链路。

MiniMax进化论:一群「偏执者」的破浪前行

用户只需要一句自然语言输入,系统就会自动调度各种工具,并且提供当初如DeepSeek R1一样的清晰思维链路,让创作优质的同时变得更可控。

根据AI产品榜数据,自上线以来,海螺AI连续6个月在全球榜单中位居视频生成AI产品的第一,力压Sora、Runway等国内外AI视频产品。

当然,Agent的另一个优势是通过集成多种工具、能力,带着目的(用户发出的需求)自主规划路径并执行,从而自主帮人类解决复杂专业问题,更通用的MiniMax Agent就是代表。

相比视频生成效果惊艳的Hailuo Video Agent,MiniMax Agent的定位更像是一个具备长期任务规划与执行闭环任务能力的AI专家,可以帮助AI完成从“Chatbot”向“专业生产力引擎”的质变升级。具体来说,MiniMax Agent是个能完成长程(Long Horizon)复杂任务的通用智能体。能多步规划出专家级解决方案、灵活拆解任务需求、执行多个子任务从而交付最终结果。

据官方数据,MiniMax Agent 在MiniMax 内部已经使用了近60天,并成为超过50%的员工日常PPT制作、网页搭建、代码辅助使用的产品。

相比普通功能单一的Agent,MiniMax Agent能在编程上生成包含复杂跳转逻辑、通过全面测试且没有bug的网页;在多模态方面除了支持长文本文件,也支持视频、音频、图片等理解能力,同时支持生成图文音并茂的作品;还能通过MCP扩展、来完成做动画、广告片、PPT等任务……

MiniMax Agent生成的卢浮宫博物馆网页

可以说,MiniMax的通用Agent,是MiniMax大模型基础智能,与跨模态能力结合起来的最强工程化能力落地。而MiniMax几乎也是唯一一家能够提供完整全模态能力的厂商。

当然,可能也有人会质疑,大模型公司做Agent的意义是什么?

拥有基座模型研发能力的大模型公司在开发通用Agent上有着天然的优势:凭借对底层架构的深入把控,其Agent能在性能优化、成本控制、生态构建形成闭环优势,从而主导开发出更强大、适应性更强的通用Agent。

一句话概括就是:大模型的创新,打开了Agent的能力天花板;Agent的快速增长,让大模型的演进方向更加清晰明确。两者就像下坡路上的滚雪球,互相借力,就能事半功倍,将生态越做越大。

MiniMax进化论:一群「偏执者」的破浪前行

如果说大模型行业是一个时间、资本、创新、知识密度一切被极度压缩的全新物种,那么身处其中,MiniMax仍然可以算得上是一家“特立独行”的存在。

MiniMax早在2022年初就成立了——比2022年底ChatGPT引爆全球还要早上一年。这也导致当年ChatGPT突然爆火之后,所有人都在四处打听这个MiniMax到底是何方神圣。

在技术路径上,MiniMax也同样敢为人先。

2023年,彼时国内市场还是Dense(稠密)模型的天下,MiniMax却将80%以上的算力和资源全部投入MoE(混合专家)模型的开发中,于2024年初推出了国内第一个MoE大模型,成为共识引领者。

今年1月,MiniMax又开源了筹谋已久的Lightning Attention闪电注意力技术,对着Transformer架构进行了一顿大刀阔斧的“爆改”,挖掘大模型突破天花板的新Alpha因子。

到了6月,MiniMax拿出的M1已经凭借100万上下文窗口、算力成本暴降70%,以及架构、算法的一系列创新,闪电拿下开源模型全球第二宝座(数据来源Artificial Analysis Intelligence Index榜单,排名截至目前)。

而与M1同期发布的MiniMax通用Agent,也已经能够解决当下无数Agent应用备受困扰的跨模态、长距离(多决策)、任务拆解、工具调用难题,完成了从工具到全能助理的进化。

这似乎是一家永远不知疲倦,永远在颠覆自我,永远在探索更高上限、更高智能水平的AI公司。

而这种近乎偏执的创新驱动,本质上是对AI大模型竞赛终局的预判,伟大商业模式往往是直白甚至浅显的——all in技术创新,然后坚定不移地执行。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2025-07-02 21:45:01

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

基调听云协办的智能观测进化论系列沙龙第一期精彩回顾
...通院稳定性保障实验室主办、基调听云协办的“智能观测进化论”系列沙龙第一期圆满召开。本场沙龙特别邀请头部可观测企业与云厂商可观测技术负责人带来深度分享,聚焦于AI大模型等智能化
2025-03-18 15:00:00
从合伙人机制到金融帝国,长鸿集团的战略进化论
在2025年的初夏,长鸿集团迎来历史性时刻。伴随“长鸿投资资产管理有限公司”成功挂牌,原“长鸿会”正式升级为“长鸿集团”。这不只是一则企业更名公告,而是一个由上万合伙人共建的智能
2025-07-14 17:37:00
“进化透镜”技术加速杂交马铃薯育种
...。我国科学家团队突破常规思维,将马铃薯育种放置在“进化论”这样广阔的视野中去研究,进而发明了“进化透镜”技术。黄三文团队收集了100份茄科和旋花科的材料(92个物种),通过基
2023-05-06 04:24:00
央广网南京5月27日消息(记者栾永胜 见习记者吕倩媛)近日,在第二十一届中国(深圳)国际文化产业博览交易会上,南京以“数字金陵”为轴,集结一众文化企业,掀起“南京创造”的产业浪潮
2025-05-28 09:58:00
奇点云发布数据云七大典型场景,携手客户共同进化
...“进化,发生在每一个数字化场景。”5月25日,以“数据进化论”为主题,由StartDT(奇点云、GrowingIO)主办的2023 StartDT Day数智科技大会在杭召开
2023-05-29 19:00:00
美图与吴欣鸿的“AI进化论”:拥抱趋势、主动求变、充满期待
6月19日,在第二届美图影像节现场上,美图一口气推出7款基于AI的新产品,其中包括AI视觉创作工具WHEE、AI口播视频工具开拍
2023-06-20 15:00:00
“数据进化论”2023数智科技大会官宣:从看、用到智能,与客户共进化
...续在解的问题。5月25日 StartDT Day数智科技大会,以“数据进化论”为题,为应对那些数据焦虑而来,为与业务问题互为映射的数据问题而来,为持续进化的客户而来。在这场大
2023-05-18 19:00:00
造物数科:在毫米级战场,书写新能源汽车的「PCB进化论」
当全球汽车产业加速向电动化、智能化转型时,一场围绕电子架构的深层革命正在展开。新能源汽车的电子元件占比已从传统燃油车的20%激增至50%,而作为所有电子系统的基础载体,PCB(印
2025-03-12 09:59:00
《时代摘要》第二季┃对话科沃斯集团董事长、添可品牌创始人钱东奇:智慧生活进化论
本文转自:新华网新华网北京10月13日电(记者 胡可璐)随着人工智能、云计算等新一代信息技术的快速发展,一大批智能产品走进千家万户。关于智慧生活的美好想象正一步步变为现实。智慧家
2023-10-13 11:31:00
更多关于科技的资讯:
青春华章丨方寸之间,用“芯”绘就星图万里
华创微系列芯片产品化在即,保障天地“对话”,筑牢算力基石 方寸之间,用“芯”绘就星图万里□南京日报/紫金山新闻记者江芬芬编者按高质量发展是“十四五”乃至更长时期我国经济社会发展的主题
2025-10-13 08:05:00
宁企为能源发电站安装“智慧大脑”“一网统管”,巡检响应时间缩短一半,停机损失降低超30% □南京日报/紫金山新闻记者孙秉印通讯员麒轩“支路电流异常
2025-10-13 08:05:00
将税务服务从“送得对”到“传得开”、从“加急办”到“秒响应”、从“被动纠错”到“主动合规”……聚焦个体工商户办税缴费需求
2025-10-13 07:23:00
算力浪潮奔涌 夯实“数字底座”——河北以数字经济赋能高质量发展(一)在中国联通(怀来)大数据创新产业园的机房内,一排排机柜昼夜不息地嗡鸣
2025-10-13 08:00:00
双11重磅福利:88VIP点外卖5折,淘宝闪购1000万份免单等你抢!
淘宝闪购推出双11重磅福利:88VIP点外卖天天享五折,免单红包数量超1000万份!10月15日至11月14日,88VIP用户进入闪购频道
2025-10-12 05:27:00
这家宁企让足球邂逅时尚
本报记者 周京震 陆春花8月17日晚,“苏超”第9轮,南京迎战盐城。聚光灯下,南京队员战衣上那簇崭新的标识格外醒目——华瑞时尚
2025-10-12 05:27:00
这支“中国笔”,国内首款!
在常州经开区潞城街道江苏德尔福医疗器械有限公司的洁净工厂内工作人员正在忙碌地装配新型“电子笔”今年该企业三个型号的预充式电子笔式注射器获得国内首张医疗器械注册证标志着该类产品正式
2025-10-12 05:27:00
山东移动5G-A护航济南地铁4号线,打通地下通信“快车道”
近日,济南轨道交通4号线彭家庄站、程家庄站、唐冶站、唐冶南站(以上站名均为工程名)已完成移动5G-A通信覆盖,标志着这条串联城市东西的“黄金线路”在通信保障上迈出关键一步
2025-10-12 08:45:00
人保财险青岛分公司:科技赋能推动农险“双精准”再升级
齐鲁晚报·齐鲁壹点记者 尚青龙近日,青岛平度的肉牛也有了自己的“数字身份证”。人保财险青岛分公司借鉴内蒙古先进经验,引入内蒙古沃付国际物联网有限公司自主研发的人工智能畜牧业数字化管理平台
2025-10-12 11:53:00
一线保障人员“时刻在岗”,烟台联通守护高铁5G网络畅通运行
国庆中秋假期期间,面对持续攀升的客运高峰,烟台联通网络保障团队坚守岗位,全力投入高铁沿线5G网络实时保障工作,通过精细化运维与快速响应
2025-10-12 11:53:00
第十九届中国(临朐)家居门窗博览会12日开幕
齐鲁晚报·齐鲁壹点 王佳潼10月11日,第十九届中国(临朐)家居门窗博览会媒体见面会在临朐召开。记者在会上获悉,第十九届中国(临朐)家居门窗博览会定于2025年10月12日至15日在临朐国际会展中心举办
2025-10-12 11:55:00
济南热力以低空智巡护航聊热入济
近日,“聊热入济”长距离供热项目施工现场传来新进展——济南能源集团所属热力集团部署的无人机智慧巡检系统,正沿这条 “供热长龙” 精准巡航
2025-10-12 15:50:00
山东移动聊城分公司圆满完成高唐一中百年校庆通信保障任务
百年薪火传,同心向未来。10月2日,聊城市高唐县第一中学建校100周年庆祝大会在高唐县隆重举行。海内外校友、各界嘉宾及在校师生欢聚一堂
2025-10-12 16:23:00
冲刺四季度 打好收官战丨湖北佳恒:以“智”提“质” 产值已超去年全年
十堰广电讯(全媒体记者 何旭 通讯员 胡新)科技创新锻造核心竞争力,湖北佳恒科技以智能化改造与自主研发双轮并进,推动企业高质量发展
2025-10-12 19:27:00
西电连续三次入选教育部“人工智能+高等教育”应用场景典型案例
近日,教育部公布第三批30个“人工智能+高等教育”应用场景典型案例遴选结果。学校《“西电智评”——数智赋能学生评价的探索与实践》案例成功入选
2025-10-12 13:56:00