• 我的订阅
  • 科技

苹果300亿参数大模型首亮相,还买了家AI公司|焦点分析

类别:科技 发布时间:2024-03-16 18:14:00 来源:36氪

文|武静静

编辑|邓咏仪

放弃造车后的苹果,正在加速入局大模型战争。

当地时间3月15日,苹果就披露了两个关键大模型动作。

其中一个值得关注的是苹果的收购事件。彭博社报道称,苹果已经收购了一家加拿大AI初创公司DarwinAI。

苹果的AI团队一下子扩充了几十个技术人员——作为收购交易的一部分,DarwinAI的几十名员工都被纳入苹果麾下,DarwinAI联合创始人、加拿大滑铁卢大学系统设计工程系教授Alexander Wong加盟苹果,担任AI团队的主管。

此前,DarwinAI的技术主要在视觉模型方向,他们此前主要给制造业提供零部件视觉检测的AI技术,致力于把AI系统打造得更小型和更快速。这符合此前苹果一直对外说的要打造更小的端侧大模型方向。

“买买买”是苹果布局AI的思路之一,此前苹果已经陆续收购了Voysis、Curious AI、 AI Music、WaveOne等初创AI公司,来不断扩充自身的AI实力。

践行收购战略的同时,苹果也在不断加大自研技术的力度。被披露收购DarwinAI的同一时间,苹果低调的在arxiv.org网站上发布论文,官宣了在多模态大模型领域的最新成果。

在论文《MM1: Methods, Analysis & Insights from Multimodal LLM Pre-training》(MM1: 多模式LLM预训练的方法、分析和见解)中可以看到,MM1是一个图文的多模态大模型,参数规模有30亿、70亿、300亿三种大小,有图像识别和自然语言推理能力。

其中,参与该论文的作者有30人,一半以上都是华人。

MM1测试效果不如Gemini和GPT4V

和市面上其他大模型相比,MM1亮点并不在惊艳的效果上,也没有提出特别的技术路线,而是通过控制各种变量,做实验,找出影响模型效果中关键因素。

在测试中,MM1-30B-Chat在TextVQA、SEED和MMMU上的表现优于Emu2-Chat37B和CogVLM-30B,但是表现不如谷歌的Gemini和OpenAI的GPT4V。

苹果300亿参数大模型首亮相,还买了家AI公司|焦点分析

MM1测试效果

苹果做了各种变量实验,通过修改数据源、修改图像分辨率等,来看各种因素对模型效果的影响。

苹果300亿参数大模型首亮相,还买了家AI公司|焦点分析

△摘自苹果发布的论文《MM1: Methods, Analysis & Insights from Multimodal LLM Pre-training》

目前,苹果发现让多模态大模型变得更聪明、效果更好的主要因素有:图像分辨率和图像标记数量对模型性能影响较大,比如更高清的图像,标注的细节越多,模型的效果就更好。视觉语言连接器对模型的影响较小,视觉语言连接器指的是可以将图像和文本结合起来,进行信息融合的一种技术。论文中也提到,虽然影响不大,但仍然需要选择合适的视觉语言连接器。不同类型的预训练数据对模型的性能有不同的影响。交错的图像文本数据和文本数据对于提高模型的少样本(few-shot)和零样本(zero-shot)性能至关重要,类似在训练时,需要使用“多样化的教材”可以帮助大模型更好地适应不同类型的问题。模型的架构和训练过程,包括模型大小和训练超参数的选择,对于模型性能很重要,可以理解为在“建造大模型大楼”的过程中,需要选择“合适的建筑材料”和“施工方法”。

模型架构上,使用了混合专家(Mixture of Experts, MoE)架构是MM1的亮点之一,苹果探索发现,在模型的前馈网络层中使用MoE架构,可以有效地扩展模型的容量而不牺牲推理速度。

我们可以将MoE架构理解为一个大型的客服中心,其中有许多专门处理不同问题的专家——有的专家专门处理技术问题,有的专家处理账单查询,还有的专家负责解答产品使用问题。在大模型训练过程中,当数据进入模型中后,大模型会像“客服中心”一样,根据问题的性质被分配给最合适的专家来解决。

在实验过程中,苹果采用了一种名为Top-2 Gating的方法,来做“调度员”,根据图像的内容和文本语义等数据特点,来决定输入数据应该被送往哪些专家处理。在处理数据过程中,苹果还采用了一种叫“稀疏激活”的方式,只选择一部分“专家”进行计算,其余处于“休眠”状态,来提高模型训练的效率。

此外,在训练大模型过程中,苹果还在3B参数的MoE模型中使用了64个专家,在7B参数的MoE模型中使用了32个专家。这些专家被分布在模型的不同层中,来提高模型处理多模态数据的能力。

为什么苹果要发布这样一篇实验性的技术论文?

目前,语言模型主要有闭源和开源两种路线,闭源模型中,人们对数据、模型架构、训练细节知之甚少。开源模型虽然会发布数据、模型、训练的细节,但是也不会发布任何模型算法设计以及工程化的细节信息。

苹果想打破这种局面,提出让大模型构建的过程变得“更透明”的路线,这是苹果为什么将各种模型训练的细节公开,发布这篇论文的原因。

苹果的大模型步调:更谨慎,落后于竞争对手

宣布停止造车后,接下来,苹果的重心都在加速大模型进程上,来追赶谷歌、微软、亚马逊。

目前,整体大模型进展,苹果对外的信息较少,看上去已经落后其竞争对手一大截。

在年初的苹果季度财报电话会议上,蒂姆·库克表示,苹果正在投入大量时间和精力将人工智能集成到其软件平台中。这些功能将在2024年晚些时候向客户提供。

库克对于透露苹果大模型细节非常谨慎,他觉得苹果工作模式是先做再说,“我认为苹果在生成式人工智能和人工智能方面存在着巨大的机会,而无需透露更多细节或超出自己的范围。”

据The Information2023年9月的一次报道,苹果每天在人工智能上投资数百万美元,正在多个团队开发多种人工智能模型。苹果构建对话式人工智能的部门被称为“基础模型”,有大约16名成员,由Apple人工智能主管John Giannandrea掌舵。

对于大众期待的大模型与苹果手机结合的业务进展,目前公开的信息也非常有限。去年8月,苹果在加州、西雅图、巴黎、北京等部门已经释放了数十个岗位,招聘大模型技术人才,其中尤其是端侧大型模型是重点。招聘信息显示,苹果希望将大型机型压缩到终端中,以便未来iPhone/iPad等核心产品可以直接运行在AIGC技术上。

The Information报道称,苹果的大语言模型内部代号是Ajax GPT,其参数规模超过2000亿,在2023年9月时,已经比OpenAI的GPT-3.5更强大。

苹果也正在试验Siri增强功能、生成视频和图像的软件,以及处理图像、视频和文本的多模式人工智能技术。此前,由于苹果一直比竞争对手更加谨慎,将隐私置于功能之上,导致Siri落后于Alexa、Google Assistan。接下来,苹果希望通过大语言模型让Siri自动执行多步骤任务。

目前,苹果正在与其AppleCare支持员工一起测试ChatGPT式的生成式AI工具“Ask”,旨在生成对技术问题的答复。此外,苹果内部也有“Apple GPT”是苹果内部的聊天机器人,但该产品仅供苹果员工使用,不会在消费产品中使用。

The Information和海通证券分析师Jeff Pu均表示,苹果将在2024年末左右在iPhone和iPad上提供某种生成式AI功能。也有人预测时间会提前,彭博社报道称,苹果将在今年6月的全球开发者大会上发布iOS 18更新。

这是一份有挑战的试卷,眼下,苹果必须加大马力,驶入这场大模型战局中。

欢迎来聊~

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-03-16 20:45:01

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

十多年来最重要的一次!库克会暗掷“王炸”吗?
...oid手机有竞争。”上个月,OpenAI发布其人工智能最新版大模型ChatGPT-4o的语音模式。在一个简短的演示中
2024-06-11 09:00:00
焦点分析丨iPhone 15系列发布,苹果终于正视起与安卓的差距
...何落地到用户的实际使用场景中。 相比于大多数基础大模型厂商,手机厂商更多选择在端侧进行模型计算。在 A17pro芯片和S9芯片上,苹果都专门开辟了一个神经网络引擎区域,大大
2023-09-13 16:05:00
苹果发布mm1.5-ui模型
...13日消息,近日,苹果公司推出了300亿参数的多模态AI大模型MM1.5,该版本是在前代MM1的架构基础上发展而来的。该模型继续遵循数据驱动的训练原则,着重探究在不同训练周期
2024-10-13 10:57:00
苹果被大模型打得措手不及
...士多德提问,并且可以得到回答”。乔布斯几乎预见了大模型技术的崛起,并坚信人工智能将为苹果公司带来远大前景。Siri是由乔布斯主导,苹果公司对人工智能最早的探索,但在库克时代,
2024-03-26 10:25:00
华为、小米抢滩登陆,AI大模型掀起手机江湖「新战事」 | 钛媒体焦点
图片来源@视觉中国今年上半年,一个接一个的大模型发布,企业之间上演了一场“百模大战”。到了下半年,大模型有些“退潮”,取而代之的是应用端的落地,让更多的用户对大模型有了深切的感知
2023-08-14 10:00:00
作者 | 袁斯来编辑 | 苏建勋大公司蜂拥入大语言模型,华为显得有些格格不入。7月7日,华为发布AI大模型盘古3.0版本。对于普通用户,这场发布会有些枯燥。政务大模型虽然有AI应
2023-07-10 12:56:00
AI大模型“国标”首批测试结果公布,人工智能成市场新焦点
12月22日,国内首个官方“大模型标准符合性评测”结果公布,百度文心一言、腾讯混元大模型、360智脑、阿里云通义千问四款国产大模型首批通过测试。测试结果称,上述四款模型符合《人工
2023-12-26 14:16:00
库克现身上海首次谈及AI话题,苹果真急了
人工智能(AI)巨头OpenAI的自研芯片和下一代大模型GPT-5又有了新进展。当地时间3月19日,据The Business Insider援引匿名知情人士的消息
2024-03-21 11:37:00
高通打响围攻英特尔的第一枪
...升 25%,目前骁龙 8Gen 3 已支持运行 100 亿参数的生成式 AI 模型。如果使用搭载 8Gen 3 平台的智能手机运行 Stable Diffusion
2023-10-26 18:02:00
更多关于科技的资讯:
明势、BAI和蚂蚁,AI投资的乐观派、悲观派和中间派聚在一场圆桌上
文|周鑫雨编辑|苏建勋如今的AI投资人,也分“乐观派”和“悲观派”。2025年9月12日,Inclusion外滩大会。在由36氪CEO冯大刚主持的圆桌论坛“AI应用落地首战
2025-09-14 17:16:00
王兴兴、朱啸虎们说了些AI创业真心话
文|周鑫雨 富充编辑|苏建勋2025年9月11日开幕的Inclusion外滩大会,为当下的AI创业者、学者和投资人,攒了一个“真心话”局
2025-09-14 19:30:00
厦门网讯(厦门日报记者 林钦圣 通讯员 江安娜)近日,我市申报的“车路协同·公交智行可视化”项目入选自然资源部、国家数据局联合发布的2025年实景三维数据赋能高质量发展创新应用典型案例
2025-09-14 08:20:00
AnPro®酵母蛋白获美国GRAS认证,定义未来可持续蛋白新标准
近日,安琪公司自主研发的AnPro®酵母蛋白(海外市场命名:AngeoPro®)正式获得美国食品药品监督管理局(FDA)的GRAS认证
2025-09-14 09:00:00
中新经纬9月13日电 (周奕航 李自曼)“编程教育的核心,不是为了培养未来的程序员,而是通过学习代码来锻炼孩子的认知能力
2025-09-14 09:11:00
合肥博主128万购买纯电动飞机 用于科技测评
大皖新闻讯 9月13日下午,在六安市金安通用机场,合肥知名科技自媒体博主张梦龙(@科技九洲君)领到了证书和钥匙,成为皖企零重力飞机工业旗下纯电动飞机“锐翔RX1E-A”的一名新机主
2025-09-14 11:12:00
沂河之滨续华章,点亮发展新路径——第九届临沂核医学与分子影像会议圆满落幕
鲁网9月14日讯9月13日,第九届临沂核医学与分子影像会议进入第二天议程,众多国内外权威专家继续围绕放射性药物研发、影像技术创新
2025-09-14 13:07:00
海尔金秋家装节 全鲁南抢海尔
当金秋的风吹过海尔智家鲁南区域的大街小巷,你只需要做一件事—打开海尔金秋家装节,全鲁南抢海尔,让"省"成为这个秋天最爽的事
2025-09-14 16:28:00
近日,一部以“2050·慈爱守护智行椅”为主题的公益视频引发关注。该作品聚焦盲人与老年人出行难题,通过科技叙事展现智能辅具如何重塑特殊群体的出行体验
2025-09-14 16:29:00
广东辰奕智能科技股份有限公司因出口商品商标侵权被行政处罚
近日,中华人民共和国大鹏海关发布对广东辰奕智能科技股份有限公司出口侵犯“SONY”、“LG”商标专用权商品案行政处罚结果公示(深鹏关知罚字〔2025〕0154号)
2025-09-14 20:20:00
文具大礼包到数码全家桶,黔西南兴义“开学经济”多元消费场景火爆
随着贵州省2025年秋季学期正式开学,黔西南州各中小学和幼儿园敲响了上课铃,沉寂了一个暑假的校园,恢复了琅琅书声。新学期
2025-09-14 19:28:00
强数字动能,拓发展新局!贵州推动数字经济高质量发展
在国家大数据(贵州)综合试验区交流体验中心,正门口一个由圆形LED屏构成的“数据之眼”十分醒目。这个独特的设计,寓意世界将从这里看见不一样的贵州
2025-09-14 12:11:00
2025年上半年,工银私人银行凭借在综合实力、数字化运营、专业服务、全球网络及绿色可持续发展领域的突出优势,荣获“卓越私人银行奖”“中国最佳数字化营销与传播私人银行”“中国最佳数
2025-09-14 11:45:00
脱口秀演员「炸现场」,喜剧综艺「炸市场」
伴随《喜剧之王单口季》第二季(下称《喜单2》)圆满收官,一众“小人物”也终于走出心底的浪浪山:翟佳宁一语点醒内耗人:唯心主义的最高境界是唯我独尊
2025-09-14 06:43:00
日前,山西转型综改示范区入区企业潞安化工机械(集团)有限公司成功通过国家市场监督管理总局的严格审核,获颁压力容器分析设计(SAD)许可资质
2025-09-14 07:28:00