• 我的订阅
  • 科技

OpenAI掀小模型血战!苹果DCLM强势登场,碾压Mistral 7B全开源

类别:科技 发布时间:2024-07-22 09:41:00 来源:新智元

OpenAI掀小模型血战!苹果DCLM强势登场,碾压Mistral 7B全开源

【新智元导读】小模型时代来了?OpenAI带着GPT-4o mini首次入局小模型战场,Mistral AI、HuggingFace本周接连发布了小模型。如今,苹果也发布了70亿参数小模型DCLM,性能碾压Mistral-7B。

小模型的战场,打起来了!

继GPT-4o mini、Mistral NeMo发布之后,苹果也入局了。

DCLM小模型包含两种参数规模——70亿和14亿,发布即开源。最大70亿参数超越了Mistral-7B ,性能接近Llama 3、Gemma。

OpenAI掀小模型血战!苹果DCLM强势登场,碾压Mistral 7B全开源

根据苹果ML小组研究科学家Vaishaal Shankar(也是DCLM研发人员)的说法,这是迄今为止性能最好的「真正开源」的模型,不仅有权重和训练代码,而且是基于开放数据集DCLM-Baseline。

OpenAI掀小模型血战!苹果DCLM强势登场,碾压Mistral 7B全开源

相比模型性能,DCLM做出的「真正开源」的典范更加引人关注。

对比大部分科技巨头只搞闭源模型,或「犹抱琵琶半遮面」,。

OpenAI掀小模型血战!苹果DCLM强势登场,碾压Mistral 7B全开源

此外,Shankar还预告说,之后会继续上线模型中间检查点和优化器状态。

OpenAI掀小模型血战!苹果DCLM强势登场,碾压Mistral 7B全开源

难道,这就是LLM开源社区的春天了吗?

OpenAI掀小模型血战!苹果DCLM强势登场,碾压Mistral 7B全开源

DCLM系列全开源

目前,HuggingFace上已经发布了全部模型权重,其中的模型卡已经基本涵盖了关键信息。

OpenAI掀小模型血战!苹果DCLM强势登场,碾压Mistral 7B全开源

https://huggingface.co/apple/DCLM-7B

DCLM-7B同样采用了decoder-only的架构,使用PyTorch和OpenLM框架进行预训练。

总共4T token的DCLM-baseline数据集来自于总量240T的DCLM,DCLM-7B模型又进一步过滤出其中的2.5T用于训练。

OpenAI掀小模型血战!苹果DCLM强势登场,碾压Mistral 7B全开源

上下文长度为2048,小于Mistral 7B和Gemma 2 9B的8k长度。

性能方面,作者直接使用评估套件LLM Foundry,测试了模型在53个基准任务上的分数。

与其他模型进行比较时,除了MMLU分数,作者还自定义了两个指标——「核心准确率」(core)和「扩展准确率」(extended)。

前者是包括HellaSwag和ARC-E在内的22个任务中心准确率的均值,后者则涵盖全部53个任务。

与虽然使用的数据不是最多,但与其他同等大小的开放数据模型(权重与数据集都开源)相比,DCLM在全部3个指标上的性能都达到了最佳。

OpenAI掀小模型血战!苹果DCLM强势登场,碾压Mistral 7B全开源

三列基准分数从左到右分别是:核心、MMLU、扩展

相比之前的SOTA MAP-Neo模型,DCLM-7B在5-shot的MMLU任务准确率达到63.7%,提升了6.6个百分点,同时训练所需的计算量减少了40%。

然而,如果和权重开源、数据集闭源的模型相比,效果就不尽如人意了。

DCLM在各个指标上都与Phi-3存在不小差距,与Mistral-7B-v0.3或Gemma 8B的分数大致相当。

OpenAI掀小模型血战!苹果DCLM强势登场,碾压Mistral 7B全开源

研究人员发现,如果使用同一数据集中额外的100B数据进行训练,并将上下文长度扩展到8k时,模型在核心和扩展基准上的分数还会进一步提升,但MMLU结果没有变化。

OpenAI掀小模型血战!苹果DCLM强势登场,碾压Mistral 7B全开源

这个结果,就全面超过了Mistral 7B-v0.3的分数。

此外,HuggingFace上还发布了7B模型的指令微调版本,在数学推理任务GSM8K上的性能实现大规模提升,分数由原来的2.1直接飙到52.5。

OpenAI掀小模型血战!苹果DCLM强势登场,碾压Mistral 7B全开源

https://huggingface.co/apple/DCLM-7B-8k

除了7B版本,1.4B版本也同步上线。神奇的是,训练数据量相比7B版本不降反增,多了0.1T。

OpenAI掀小模型血战!苹果DCLM强势登场,碾压Mistral 7B全开源

https://huggingface.co/TRI-ML/DCLM-1B

相比HuggingFace最近发布的SmolLM,DCLM-1B的性能显著更优,尤其是5-shot MMLU分数,比SmolLM提升了11.9%。

不仅如此,DCLM-1B在MMLU上41.9的得分也同样高于Qwen-1.5B的37.87和Phi-1.5B的35.90。

OpenAI掀小模型血战!苹果DCLM强势登场,碾压Mistral 7B全开源

7B模型落后的事情,反而让1.4B模型反超了,果然小模型才是苹果的看家本领。

值得注意的是,7B模型仅能在Apple的示例代码许可(ASCL)下使用,但1.4B版本在Apache 2.0下发布,允许商业使用、分发和修改。

既然说到这次发布的DCLM系列模型,就不得不提它们的重要基础——DataComp基准。

OpenAI掀小模型血战!苹果DCLM强势登场,碾压Mistral 7B全开源

论文地址:https://arxiv.org/pdf/2406.11794

DataComp这篇论文首发于6月17日,共同一作Jeffrey Li、Alex Fang和共同最后作者Vaishaal Shankar,也同样都是苹果DCLM的研发人员。

文章不仅对数据集的构建过程进行了详细阐述,也提到了关于DCLM模型的部分内容。

Vaishaal Shankar表示,将很快发布这篇论文的更新版,提供更多有关模型预训练的技术细节。

相比于对同一数据集修改模型,DataComp的思路反其道而行之——测评所用的模型是固定的,任务是在总共240T的数据池中过滤、处理出最好的数据。

可以说,这种做法与科技巨头们的研发思路非常一致——对于LLM的性能而言,预训练数据正在成为比模型架构和权重更重要的因素。

毕竟,Llama、Gemma、Phi等一系列「开源」模型都是只放权重、不公布数据。

既要Scaling Law,又要SLM

对于AI科技巨头来说,有时模型不是越大越好。

OpenAI掀小模型血战!苹果DCLM强势登场,碾压Mistral 7B全开源

其实一直以来,AI社区中,并不缺少小模型,比如微软Phi系列模型多次迭代,以及6月末谷歌刚刚更新的Gemma 2 7B。

这周,OpenAI突然发布GPT-4o mini,Mistral AI联手英伟达发布Mistral NeMo,HuggingFace的SmoLLM等小模型的发布,为小模型的领域再次添了一把火。

正如OpenAI研究员所言,「虽然我们比任何人都更喜欢训练大模型,但OpenAI也知道如何训练小模型」。

OpenAI掀小模型血战!苹果DCLM强势登场,碾压Mistral 7B全开源

小模型,优势在于成本低、速度快、更专业,通常只使用少量数据训练,为特定任务而设计。

大模型变小,再扩大规模,可能是未来发展的趋势之一。

OpenAI掀小模型血战!苹果DCLM强势登场,碾压Mistral 7B全开源

前两天,在GPT-4o mini发布时,Andrej Karpathy也发表长推表达了类似的观点。

OpenAI掀小模型血战!苹果DCLM强势登场,碾压Mistral 7B全开源

他认为,模型尺寸的竞争将会「反向加剧」,不是越来越大,反而是比谁更小更轻巧。

当前的LLM之所以逐渐变成「巨兽」,是因为训练过程仍然非常浪费,我们基本上是在要求模型记住整个互联网的内容(而且实际上,LLM的记忆能力还相当不错,质量上比人类好很多)。

但对于小模型来说,训练目标已经改变。关键问题是,AI系统如何从更少的数据中学到更多。

我们需要模型先变得更大,再变得更小,因为我们需要「巨兽」将数据重构、塑造为理想的合成形式,逐渐得到「完美的训练集」,再喂给小模型。

马斯克也表示同意这个观点。Karpathy所描述的这个模型改进阶梯,正是现实中特斯拉曾走过的路。

OpenAI掀小模型血战!苹果DCLM强势登场,碾压Mistral 7B全开源

23年4月,Sam Altman曾宣布了AI大模型时代终结。最近采访中,他还确认了数据质量是进一步AI训练的关键成功因素。

OpenAI掀小模型血战!苹果DCLM强势登场,碾压Mistral 7B全开源

微软研究人员在开发Phi模型时,就提出了这样的假设。Hugging Face的AI研究人员最近也证实了这一假设,并发布了一个高质量的训练数据集。

就以GPT-4为例,开发和使用超一万亿参数的成本超过了1亿美元。

而小模型,比如专在法律数据集上完成训练,可能使用不到100亿参数,成本不到1000万美元,使用更少算力响应每个查询,因此成本较低。

纳德拉曾表示,Phi⼩型模型系列规模仅为OpenAI背后免费模型1/100,而且在许多任务上的表现几乎同样出色。

OpenAI掀小模型血战!苹果DCLM强势登场,碾压Mistral 7B全开源

除此以外,谷歌以及AI初创公司Mistral、Anthropic、Cohere今年也发布了规模较小的模型。

6月,苹果曾公布了自己的AI发展路线图,计划使用小型模型,这样就可以完全在手机上运行软件,使其更快速和更安全。

对于许多任务来说,比如总结文档或生成图像,大模型可能有点大材小用。

Transformer开山之作背后作者Illia Polosukhin表示,计算2+2不应该需要进⾏千万亿次运算。

不过,科技巨头们也并没有放弃大模型。苹果在今年WWDC大会上,曾宣布了在Siri助手中植入ChatGPT,以执行撰写电子邮件等复杂任务。

毕竟通往终极AGI/ASI,参数规模的扩大和智能的增长成正比。

OpenAI掀小模型血战!苹果DCLM强势登场,碾压Mistral 7B全开源

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-07-22 12:45:03

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

“苹果智能”大更新:几乎全球可用,强势登陆Vision Pro!
财联社4月1日讯(编辑 黄君芝)美东时间周一(3月31日),苹果公司(Apple)传来好消息:伴随着系统更新,“苹果智能”(Apple Intelligence)正式向全球更多用户开放
2025-04-01 10:57:00
小米超越苹果登顶中国第一,雷军:能拿第一确实不容易
...图片来源:中国信通院微信官方账号截图2023年,华为的强势回归,小米的高端化战略成果初显,都为沉寂已经的手机市场注入了新的动力。在中国信通院发布数据的同时,小米集团合伙人、R
2024-01-24 16:18:00
寻找“中国AI合伙人”?一季度业绩销量齐下滑,苹果本地化AI短板待补齐
...,截至发稿,苹果和阿里巴巴未给出相关回复。随着华为强势回归,苹果在中国市场压力倍增。2024年一季度,TechInsights研报指出
2024-06-26 09:15:00
安卓、鸿蒙抢跑大模型,“落后”的iPhone 15要被吊打?
....7%,重新找回了增长势头。iPhone 11在全球市场的表现更为强势。市场统计机构Omdia公布的数据显示,2019年9月发布后
2023-08-08 23:01:00
高端手机格局再生变数,华为赋魅、苹果祛魅
...智能手机祛魅很大程度上是因为华为这一最强大竞争对手强势崛起。 华为赋魅,强势回归和压力重重的苹果不同,华为智能手机沉寂两年后强势回归,新赛季喜报连连。因为众所周知的原因,华
2024-05-13 09:35:00
消费电子年内表现出色,前瞻指标和创新周期让复苏“两翼齐飞”
...周末,双11大促落下帷幕,消费电子成为今年双11中表现强势的品类之一,各大厂商销量大幅增长,小米更是凭借第一部搭载晓龙8GEN 3新一代芯片的手机创下公司历史同期销量记录。消
2023-11-16 15:30:00
真“富可敌国”!苹果(AAPL.US)快顶得上一整个法国股市了
...CAC 40指数周已经创下历史最高点,但“股王”今年以来的强势表现甚至令CAC 40指数黯然失色。 受路易威登(Louis Vuitton)母公司LVMH和Birkin制造商爱马仕等奢侈品公司股价暴涨带来的巨大推动力
2023-12-15 11:19:00
iOS 18终于融入AI技术,但外援或许难救掉队的苹果
...市场竞争中失去优势。尽管苹果在品牌和生态系统上依然强势,但面对竞争对手在AI领域的迅速推进,苹果需要突破目前的困境,寻求更为创新的解决方案,以维持其市场领导地位。
2024-06-17 23:09:00
WWDC24没有王炸,AI正在动摇苹果根基
...。但正如AI让苹果猝不及防,进入2024年,凭借在AI领域的强势崛起,微软、英伟达市值先后超过苹果。站在下一个时代浪潮的起点,投资者用钱选出了新的创新旗帜。这时我们再回味巴菲
2024-06-11 13:52:00
更多关于科技的资讯:
聚焦2025中国国际数字经济博览会·访谈|沈昌祥:发挥优势,不断筑牢人工智能安全底座
发挥优势,不断筑牢人工智能安全底座——访中国工程院院士沈昌祥中国工程院院士沈昌祥。 河北日报记者 李东宇摄2025中国国际数字经济博览会的主题为“可信数据赋能产业发展”
2025-10-18 08:25:00
10月17日,2025中国国际数字经济博览会,一款AI绘画机器人精准识别人脸神态,快速绘画出人脸素描,被这只机械臂画得心服口服。(摄制:苏畅、白中豪、朱泊宇)
2025-10-18 08:27:00
深化开发利用,让高质量数据“动”起来——2025中国国际数字经济博览会探新之一机器人亮绝活、大模型总动员、虚拟空间沉浸体验……10月17日
2025-10-18 08:37:00
厦门网讯(厦门日报记者 薛尧)苹果iPhone17 Air昨日正式开启预售,这款取消实体卡槽、仅支持eSIM(嵌入式虚拟SIM卡)的新机
2025-10-18 08:59:00
近日,建设银行正式启动“‘享趣’玩·惠游中华”信用卡活动,为客户提供涵盖景区票务、特色餐饮、文创消费等多方面的用卡优惠
2025-10-18 10:41:00
海信贾少谦:AI重塑企业管理模式,打法要快,生意要慢
10月17日,第十五届中国管理·全球论坛暨首届“中国企业管理最佳实践榜”发布盛典在青岛举办。作为C50+2025年度轮值企业家召集人
2025-10-18 10:57:00
竹溪县数字经济产业链招商签约超亿元
十堰广电讯(全媒体记者 白孟尧 通讯员 付延峰)竞逐数字经济新赛道,孕育产业链招商硕果。10月18日,湖北十堰竹溪县竹溪数字经济产业链招商暨2025“国芯一号”生态合作伙伴大会在桃花岛夯土小镇举行
2025-10-18 13:47:00
东南网龙岩10月17日讯(通讯员 陈碧霞)近日,工行龙岩漳平支行组织青年志愿者主动深入当地企业园区,精心开展集“个人金融产品精准营销”与“金融反诈知识普及”于一体的“一站式”综合服务活动
2025-10-18 16:32:00
烟台银行荣登2025上半年度高质量数字化转型十大典型案例榜单
近日,由中国信通院主办的以“洞见十五五”为主题的2025数字生态发展大会暨“铸基计划”年中会议在北京盛大召开。会上,烟台银行联合长亮科技申报的《DataOps赋能烟台银行建设高质量智能数据中枢》案例
2025-10-18 17:45:00
视源股份广交会展示AI全场景创新实力,机器人机器人系列产品亮相成焦点
在第138届中国进出口商品交易会(广交会)上,视源股份以“AI+未来教育、AI+企业服务、AI+机器人、AI+生活”为主线
2025-10-18 18:18:00
本土智造重磅升级,医科达将八度亮相进博
第八届中国国际进口博览会(进博会)进入倒计时,作为八年“全勤生”,全球精准放疗先锋医科达将以“共建本土生态,共筑抗癌未来”为主题
2025-10-18 18:42:00
不用等到20号了!现在来京东11.11 iPhone 17 Pro系列可领300元惊喜券
每年11.11对于广大果粉而言无疑是换新的绝佳时机,无论是追求最新款还是预算有限入手上一代机型都能享受到极具吸引力的价格
2025-10-18 18:43:00
破局重构引领前行,联众优车持续锻造二手车服务新基建
近年来,在国内汽车消费结构持续升级的背景下,二手车市场已成为拉动汽车消费的重要引擎。特别是随着国家一系列利好政策的推出
2025-10-18 18:43:00
从龙虎到鹤年堂 京东七鲜十月品牌日再造下一个老字号联名爆款
随着“养生年轻化”与“即食化养生”成为主流,当代消费者愈发青睐“轻松养生、即时进补”。如何让传统养生智慧通过自有品牌融入日常
2025-10-18 18:43:00
全时段畅飞 全年不限次:长龙航空“365畅飞卡”10月19日在京东旅行限时开售
国内随心飞历史新低,全时段畅飞、全年不限次!在推出海航随心飞,并创下2天超25万用户下单、2亿销售额的纪录之后,京东11
2025-10-18 18:45:00