• 我的订阅
  • 科技

对标OpenAI o1!Kimi发布新一代推理模型:中考高考考研全第一

类别:科技 发布时间:2024-11-18 08:22:00 来源:浅语科技

快科技11月18日消息,日前,国内人工智能公司月之暗面推出的Kimi国产大模型正式发布k0-math。

k0-math是Kimi推出的首款推理能力强化模型,采用全新强化学习和思维链推理技术,通过模拟人脑的思考和反思过程,大幅提升解决数学难题的能力。

据了解,在多项数学基准能力测试中,k0-math的表现能对标OpenAI o1系列可公开使用的两个模型:o1-mini和o1-preview。

对标OpenAI o1!Kimi发布新一代推理模型:中考高考考研全第一

根据官方公布的结果,在中考、高考、考研以及包含入门竞赛题的MATH等4个数学基准测试中,k0-math初代模型成绩超过o1-mini和o1-preview模型,拿下第一。

对标OpenAI o1!Kimi发布新一代推理模型:中考高考考研全第一

在业界最常使用的数学能力基准测试MATH 中,k0-math模型得分93.8,超过 o1-mini的90分和o1-preview的85.5分。

官方表示,k0-math这一成绩仅次于暂未开放使用的o1完全版94.8分。

据介绍,常规模型的设定目标是尽快提供问题的答案,但k0-math不同,k0-math模型在做题过程中会花更长的时间来推理,包括思考和规划思路,并且在必要时自行反思改进解题思路,提升答题的成功率。

对标OpenAI o1!Kimi发布新一代推理模型:中考高考考研全第一

不过,月之暗面坦言,k0-math虽然擅长解答大部分很有难度的数学题,但是当前版本还无法解答LaTeX格式难以描述的几何图形类问题。

另外,k0-math还有一些局限性需要突破,包括对于过于简单的数学问题,例如1+1等于几,k0-math模型可能会过度思考,对于高考难题和IMO题目依然有一定概率做错、猜答案。

对标OpenAI o1!Kimi发布新一代推理模型:中考高考考研全第一

月之暗面表示,这些局限性既是机遇,也是挑战,预计将在下一阶段的模型迭代中逐步得到改善。

【本文结束】如需转载请务必注明出处:快科技

责任编辑:拾柒

文章内容举报

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-11-18 12:45:02

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

腾讯大模型混元Turbo:御气升昺云,梓桐金鼎开
9月5日,腾讯正式推出其新一代旗舰大模型——混元Turbo。相比前代模型,腾讯混元Turbo性能有显著提升,训练效率提升108%
2024-09-14 14:04:00
微软华人团队发布全新基准AGIEval,专为人类考试而生
...2.5%,表明了目前基础模型的非凡表现。但GPT-4在需要复杂推理或特定领域知识的任务中不太熟练,文中对模型能力(理解
2023-05-13 21:28:00
国产大模型首发中文逻辑推理,「天工大模型4.0」o1版来了
...有那些经过长期积累的公司,才能构建起改变我们生活的新一代应用。期待昆仑万维在未来给我们带来更多、更强大的技术。
2024-11-28 10:00:00
腾讯推出新一代大模型“混元Turbo”,性能大幅提升,定价低50%
9月5日,腾讯宣布推出新一代大模型“混元Turbo”,相比前代模型,腾讯混元Turbo性能有显著提升,训练效率提升108%
2024-09-05 17:29:00
腾讯推出新一代大模型「混元Turbo」,性能大幅提升,定价低50%
鞭牛士 9月5日消息,腾讯宣布推出新一代大模型“混元Turbo”。腾讯介绍,该模型采用MoE架构,比上一代产品推理效率提升100%,推理成本降低50%,解码速度提升20%。腾讯公
2024-09-05 14:28:00
连发两款模型“补课”,百度AI成色如何?
...战略。早前,百度宣布文心一言不再收费,同时还会开源新一代模型。按照计划,文心大模型4.5将在6月30日起开源。同时,行业还掀起新的大模型技术竞赛——以OpenAI、DeepS
2025-03-20 11:38:00
很强也很贵!OpenAI12天12场直播收官,官宣最新推理模型o3
...发布推理模型。11月16日,月之暗面(Moonshot AI)Kimi推出新一代数学推理模型k0-math;11月20日
2024-12-21 12:10:00
清华提出CharacterGLM;DeepMind联创发全新一代大模型;大模型版“5年高考3年模拟”来了丨AI新零售早报
...|微软&UCLA&UW联合出品》MathVista是一个多模态数学推理基准数据集,由微软、UCLA和UW联合开发
2023-12-06 09:22:00
突发!谷歌发布史上最强大模型Gemini,打爆GPT-4
...Gemini正式亮相的同时,谷歌还推出了专为大模型而设计的新一代TPU——Cloud TPU v5p。那么,你觉得这一波
2023-12-07 09:35:00
更多关于科技的资讯:
“生物制药工艺与设备发展新趋势研讨会”于10月16日下午举行,麦济生物、艾捷博雅科技、碧博生物等企业的代表,就生物制药工艺优化与设备选型提供了新思路与新方法。责编:卢思宇、姚凯红
2025-10-27 10:19:00
河北日报讯(记者刘英、刘杰)近日,经省科技厅批准,由廊坊润泽科技发展有限公司牵头组建的省级创新联合体——河北省人工智能创新联合体成立
2025-10-27 08:07:00
厦门网讯 (厦门日报记者 薛尧) “品牌金饰每克突破1100元,自己买工具打首饰能省近一半!”近日,受国际金价持续震荡
2025-10-25 08:13:00
南报网讯(记者何洁)10月22日至24日,由《自然》系列期刊编辑部和南京大学及中国生物物理学会联合主办的首届“人工智能生物学”国际学术会议在南京举行
2025-10-25 08:53:00
近日,胜利石油工程公司管具技术服务中心井控装置试压泵保压阀成功实现部件自主化维修,彻底改变以往依赖外部采购的被动局面。这次突破
2025-10-25 09:27:00
春雪食品斩获IDC未来企业大奖
近日,第十届IDC中国CIO峰会在上海落幕。莱阳春雪食品集团以数字化重塑全产业链的硬核实践,荣获“IDC未来企业大奖-卓越奖”
2025-10-25 12:55:00
AI搜索流量占比突破45%的2025年,头部GEO服务商正以技术代差重塑市场格局,这份基于1200+企业实战数据的白皮书
2025-10-25 14:27:00
抗衰冻龄选对成分是关键!2025全球五大麦角硫因品牌深度测评&选购指南
衰老的本质是细胞层面的多维损伤叠加 —— 自由基氧化、线粒体功能衰退、DNA 修复能力下降等机制相互交织,单一成分干预早已无法满足科学抗衰需求
2025-10-25 14:29:00
深耕眼科近30载,菏泽摘镜“标杆”王丽霞院长解说全飞秒4.0
通讯员 任兆潘在菏泽近视矫正领域,王丽霞院长的名字早已成为 “专业” 与 “放心” 的代名词。作为菏泽华厦眼科医院业务副院长
2025-10-25 14:39:00
“赞上合、聚天马,展风采,新体验”,2025天津马拉松将于10月26日鸣枪起跑。10月26日6:55至10:25,天津海河传媒中心《奔跑吧
2025-10-25 15:26:00
星光不负,码向未来 ———选择鸿蒙的800万种可能
摘要:每一位开发者都在用自己的方式点亮属于自己那颗星在这个追求效率的时代,技术的温度,正藏身于那些被巧妙化解的日常困境里
2025-10-25 15:44:00
同程旅行完成收购万达酒管,专业商旅平台成就“更高端”的出行体验
近日,同程旅行宣布完成对万达酒店管理公司的战略收购。这次收购远不止于简单的资源叠加,而是OTA乃至商旅服务生态的一次战略性升级
2025-10-25 15:45:00
可信数据空间新产品新服务新生态发布会在杭州中国数谷举行
2025年10月22日,“可信数据空间新产品·新服务·新生态发布会”在杭州中国数谷会议中心隆重举行。大会由北京燕元数联网络科技有限公司
2025-10-25 15:47:00
10月24日,我省首个脑机接口临床研究中心在山医大一院成立。山西医科大学将与清华海峡研究院协同创新中心在脑机接口这一前沿项目方面展开深入合作
2025-10-25 19:08:00
据第三方权威数据显示,2025年头部与尾部GEO服务商的效果差距已达430%,而企业更换服务商的平均成本高达首年投入的150%
2025-10-25 21:10:00