• 我的订阅
  • 科技

杨仝团队发布FairyR1模型:5%参数量数学和代码能力超越满血DeepSeek

类别:科技 发布时间:2025-05-28 14:17:00 来源:数字化报

北京大学杨仝教授团队近期发布了其在高效大型语言模型研究方向的一项新成果——FairyR1-32B模型。该模型基于DeepSeek-R1-Distill-Qwen-32B基座,通过结合微调与模型合并技术构建。研究探索了在参数量大幅减少的情况下,模型在特定任务上实现与更大模型相当甚至更优性能的可能性。该研究得到了国家自然科学基金委项目(624B2005,62372009)的资助。FairyR1-32B模型已在huggingface开源:https://huggingface.co/PKU-DS-LAB/FairyR1-32B。

FairyR1-32B模型是在团队前期TinyR1工作基础上进行的进一步探索,沿用了“分合蒸馏”的研究思路,提出了多种改进方法,包括自我合并、多教师交叉蒸馏、轻蒸馏等方法,并在数据处理进行了优化,模型精度有了显著提升。

本次工作重点改进了蒸馏数据的构建流程,对来源于AI-MO/NuminaMath-1.5(数学)和open-thoughts/OpenThoughts-114k(代码)等数据集的原始数据,通过多个“教师模型”生成答案,随后对问答数据进行精心筛选、结构调整与思维链优化,并进行多阶段筛选。筛选过程包括基于答案的正确性验证(针对数学数据),以及基于长度的筛选(数学数据保留2k-8ktokens范围,代码数据保留4k-8ktokens范围),最终构建了更具针对性的约6.6k条数学数据和约3.8k条代码数据用于训练。

在模型结构方面,研究团队尝试训练两个领域(数学和代码)的专业模型进行合并,旨在进一步优化流程和资源消耗。这两个专业模型在一致的训练参数下(例如相同的学习率和批次大小)独立训练约5个周期后,利用AcreeFusion工具进行了合并。在多个公开基准测试中,FairyR1展现出了在低参数量下的竞争力表现。以下为FairyR1与DeepSeek-R1-671B及DeepSeek-R1-Distill-Qwen-32B在部分基准上的得分对比:

杨仝团队发布FairyR1模型:5%参数量数学和代码能力超越满血DeepSeek

从测试结果可以看出,FairyR1-32B在AIME2025和LiveCodeBench基准上得分略高于DeepSeek-R1-671B,在AIME2024上表现接近。在GPQA-Diamond科学基准上,FairyR1的得分低于DeepSeek-R1-671B。这些结果表明,FairyR1在采用DeepSeek-R1-Distill-Qwen-32B基座并经过特定技术处理后,能够在约5%参数量的情况下,在数理和编程等领域实现与大型模型相当或略优的性能水平,但在科学等其他领域可能存在差距。这项工作探索了通过优化的数据处理和模型融合技术,在保证特定任务性能的前提下,大幅降低模型规模和潜在推理成本的可能性。

北京大学杨仝教授团队表示:“FairyR1-32B模型是我们探索高效大型语言模型技术路线的阶段性成果。通过对蒸馏和合并方法的改进,我们初步验证了在有限资源下实现高性能模型的可行性。”

团队成员:李旺、周俊廷、刘文睿、姚一伦、王融乐、杨仝

杨仝团队发布FairyR1模型:5%参数量数学和代码能力超越满血DeepSeek

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2025-05-28 17:45:02

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

阿里Qwen3登顶全球最强开源模型,用8款模型夺回中国AI话语权
出品 | 搜狐科技作者 | 梁昌均编辑 | 杨锦一口气开源8款模型,阿里通义又上新!4月29日一大早,阿里开源发布Qwen3
2025-04-29 16:17:00
Llama版o1来了,来自上海AI Lab,强化学习代码已开源,
复刻OpenAI o1推理大模型,开源界传来最新进展:LLaMA版o1项目刚刚发布,来自上海AI Lab团队。简介中明确
2024-11-06 09:49:00
李开复AI公司首发大模型,阿里云领投 | 36氪独家
...复成立的AI公司“零一万物”发布了首款开源中英双语大模型“Yi”。与此同时,36氪获悉,零一万物已完成新一轮融资,由阿里云领投
2023-11-06 12:13:00
字节开源全栈AI编程基准,不小心曝光豆包代码大模型
豆包代码大模型,不小心给曝光了!在字节开源的代码大模型评估基准FullStack Bench里面,出现了此前字节未披露过的Doubao-Coder
2024-12-06 09:50:00
阿里最新开源推理模型发布:性能比肩DeepSeek-R1
阿里通义发布最新开源推理模型,称其性能比肩DeepSeek-R1。3月6日凌晨,阿里巴巴正式发布最新的开源推理模型通义千问QwQ-32B
2025-03-06 13:22:00
阿里推出全新推理模型:仅1/21参数媲美DeepSeek R1
...里Qwen团队正式发布他们最新的研究成果——QwQ-32B大语言模型。这是一款拥有320亿参数的模型,其性能可与具备6710亿参数(其中370亿被激活)的DeepSeek-R1媲美
2025-03-06 07:42:00
最强数学大模型易主!阿里千问新模型成绩超GPT-4o
最强数学大模型,现在易主!阿里千问大模型团队发布的Qwen2-Math,不仅超越了Llama 3.1-405B,也战胜了GPT-4o
2024-08-10 09:45:00
...太好的文科生业内人士如何看待这个多模态预训练大语言模型?记者采访了上海交通大学教授、自然语言处理专家赵海。“读图编程”表演令人惊艳赵海教授解释,模态对应的是人类感知类型,包括
2023-03-16 09:23:00
阿里国际发布最新开源多模态模型Ovis,多模态能力再升级
...力再次升级!今天,阿里国际AI团队发布了一款多模态大模型Ovis,在图像理解任务上不断突破极限,多种具体的子类任务中均达到了SOTA(最新技术)水平。多模态大模型能够处理和理
2024-09-20 13:35:00
更多关于科技的资讯:
2025年,对于数禾科技而言意义非凡。这不仅是公司走过十年风雨、迈向全新征程的里程碑之年,更是品牌战略全面升级的关键节点
2025-08-06 12:07:00
李想透露理想i8小订用户超3万,此前宣布i8统一版本为Max,价格下调为33.98万元
8月5日,理想汽车CEO李想发布视频,就理想i8车型配置改动一事与用户进行分享交流,解答了理想i8为什么要统一配置版本这一核心问题
2025-08-06 13:05:00
速看!8月最值得pick的“心动”清单
导语:盛夏热浪来袭,暑期消费热潮全面爆发!孩子们在研学旅行中探索世界,大人们在避暑胜地享受悠闲时光,情侣们为七夕精心准备浪漫惊喜
2025-08-06 10:35:00
珠海监控安装知名公司?弱电行业标杆企业:广东俊逸智能科技
在珠海乃至华南地区弱电智能化产业的壮阔版图上,广东俊逸智能科技有限公司正以绝对的领军姿态,镌刻下属于强者的深刻印记。作为区域内弱电智能化领域的翘楚
2025-08-06 10:36:00
弱电智能化服务优选:广东俊逸智能覆盖监控道闸楼宇BA等多领域
在智能化浪潮席卷各行各业的今天,弱电工程及监控安装、道闸安装、楼宇BA、商业综合体智能化等领域的需求愈发旺盛。而在这片充满机遇与挑战的市场中
2025-08-06 10:36:00
践行产品责任,引领绿色风尚:万达酒店及度假村荣获证券之星ESG“产品责任奖”
在日前举办的“2025证券之星ESG年度论坛暨第三届ESG新标杆企业奖”颁奖典礼上,万达酒店及度假村凭借其在产品责任领域的卓越实践与创新成果
2025-08-06 10:36:00
从“6平方米限制”到“操作流程审查”,从设备配置“硬要求”到“适度简化”的弹性机制……8月1日起,新修订的《北京市食品经营许可审查细则》(简称“新规”)正式实施
2025-08-06 10:54:00
今年夏季全国多地持续刷新历史高温纪录,部分地区连续数日出现 40℃以上极端天气。持续高温对居民日常生活造成严重影响,不仅考验着空调性能
2025-08-06 08:37:00
抹茶刚到手,价格就暴涨,国产品牌正迎向新风口
作者:郑艺阳其实你早就在喝国产抹茶。“本来以为是冲动消费,居然一夜间变成理财产品”。海外消费者王擎夏(化名)向《消费者报道》记者报料说
2025-08-06 05:54:00
杭州日报讯 “作为塑料建材专业生产企业,南美地区是我们重点开拓的海外市场。”近日,德清企业华之杰塑料建材有限公司(以下简称“华之杰”)总经理丁凌烨向记者介绍
2025-08-06 06:29:00
“中国陶瓷煲都”的另一面:黎川人悄然拿下办公家具半壁江山
赣地灵泉润物功,千家木色出山蓬。在办公家具行业舞台上,黎川人正上演一场令人惊叹的逆袭传奇。如今,遍布全国的黎川人创办家具企业超3000家
2025-08-06 06:38:00
人形机器人领域以398.1%增速居榜首每日商报讯 从生产车间复杂装配的熟练操作,到展会上为大家递出的现磨咖啡,再到开渔现场第一网江鲜的运送……如今
2025-08-06 07:00:00
杭州日报讯 近日,上城资本集团参与投资的北京智谱华章科技股份有限公司(下称“智谱”)正式发布新一代旗舰大模型GLM-4
2025-08-06 06:29:00
韶音闪耀2025ChinaJoy:OpenDots ONE斩获黑金奖,引领开放聆听新风尚
8月1日,2025第22届中国国际数码互动娱乐展览会(ChinaJoy)在上海新国际博览中心正式拉开序幕,作为全球开放式耳机领域的知名品牌
2025-08-05 11:05:00
宠咕咕饮水、喂食科学守护,为您打造一体化健康养宠体验
在宠物成为“家人”的当下,我们发现,爱不仅是陪伴,更是理解与守护。而真正的守护,离不开科学的工具与智慧的洞察。成立以来
2025-08-05 11:05:00