• 我的订阅
  • 科技

苹果发布mm1.5-ui模型

类别:科技 发布时间:2024-10-13 10:57:00 来源:浅语科技

10月13日消息,近日,苹果公司推出了300亿参数的多模态AI大模型MM1.5,该版本是在前代MM1的架构基础上发展而来的。

该模型继续遵循数据驱动的训练原则,着重探究在不同训练周期中混合各类数据对模型性能产生的影响,相关模型文档已在HuggingFace上发布。

MM1.5提供了从10亿到300亿的多种参数规模,拥有图像识别和自然语言推理能力。

在新版本中,苹果公司的研发人员改进了数据混合策略,极大地增强了模型在多文本图像理解、视觉引用与定位以及多图像推理等方面的能力。

参考论文可知,团队在MM1.5的持续预训练阶段引入了高质量的OCR数据和合成图像描述,这显著提高了模型对包含大量文本的图像的理解水平。

此外,研究人员在监督式微调阶段深入分析了不同数据类型对模型表现的作用,优化了视觉指令微调数据的混合方式,使得即便是小规模的模型(如10亿、30亿参数版本)也能有出色的发挥,实现了更高的效率。

值得一提的是,苹果公司这次还推出了专门用于视频理解的MM1.5-Video模型和专门处理移动设备用户界面(UI)理解的MM1.5-UI模型。

其中,MM1.5-UI模型未来有望成为iOS背后的“苹果牌”AI,能够处理各种视觉引用与定位任务,还能总结屏幕上的功能,或者通过与用户的对话进行交互。

尽管MM1.5模型在多项基准测试中表现优异,但苹果团队仍计划通过进一步融合文本、图像和用户交互数据,并设计更复杂的架构,来提升模型对移动设备UI的理解能力,从而让“苹果牌”AI更强大。

苹果发布mm1.5-ui模型

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-10-13 14:45:07

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

苹果300亿参数大模型首亮相,还买了家AI公司|焦点分析
...武静静编辑|邓咏仪放弃造车后的苹果,正在加速入局大模型战争。当地时间3月15日,苹果就披露了两个关键大模型动作。其中一个值得关注的是苹果的收购事件。彭博社报道称,苹果已经收购
2024-03-16 18:14:00
苹果大模型,不藏了
岁末年初,苹果加快了在大模型领域的步伐。上个月,苹果先是推出了名为Ferret的多模态大语言模型,图像处理技术堪称惊艳;而后又发布了一篇题为《闪存中的大型语言模型:在有限内存下高
2024-01-06 09:10:00
详解苹果牵手OpenAI:合作只是一场噱头
...的记录里。值得一提的是,苹果与OpenAI合作使用的是GPT-4o模型,苹果用户无需注册OpenAI账户即可免费使用
2024-06-20 13:28:00
苹果被大模型打得措手不及
...饱受争议。3月21日,美国司法部和十几个州的总检察长对苹果公司提起了反垄断诉讼。随即,苹果股价低开低走,收跌4.09%
2024-03-26 10:25:00
一块GPU都没用,苹果自研大模型干翻GPT-4?
...,上线Apple Intelligence的首个版本,同时47页的苹果自研大模型技术报告重磅发布。Apple Intelligence首个版本上线了以下AI功能
2024-07-31 09:37:00
苹果的人工智能为何与众不同?高管这样说
...大超级计算机,以开发更为复杂且耗电量更高的人工智能模型。而用户通常需要通过互联网与同样强大的服务器进行交互,才能访问这些人工智能软件。苹果对人工智能的愿景并非局限于构建庞大的
2024-06-13 09:27:00
苹果开源7B模型,训练过程数据集一口气全给了,网友:很不像苹果
苹果最新杀入开源大模型战场,而且比其他公司更开放。推出7B模型,不仅效果与Llama 3 8B相当,而且一次性开源了全部训练过程和资源
2024-07-23 09:33:00
苹果正悄悄开发大模型,会是乔布斯心中的ChatGPT吗?
...跟“乔布斯”对话。只要输入相应的数据以及训练,AI大模型就能复刻出“亚里士多德”。只是这样的科技创新,并不来自苹果,而是OpenAI。苹果,当然也不甘心。就在日前,市场消息称
2023-07-21 15:11:00
苹果的封闭生态为大模型打开!发布开源多模态大模型、每天为 AI 烧百万美元,零碎的 Android 生态打得过吗?
整理 | 核子可乐、褚杏娟“苹果公司在 LLM 方面一直表现不佳,但他们一直在不断发展‘硬件 + 软件人工智能’堆栈,没有太多耀眼的广告
2023-12-26 14:06:00
更多关于科技的资讯: