• 我的订阅
  • 科技

Meta 推出 Apollo 开源模型,让 AI “看懂”视频

类别:科技 发布时间:2024-12-19 09:31:00 来源:IT之家

IT之家 12 月 18 日消息,Meta 携手斯坦福大学,推出全新 AI 模型系列 Apollo,显著提升机器对视频的理解能力。

IT之家注:尽管人工智能在处理图像和文本方面取得了巨大进步,但让机器真正理解视频仍然是一个重大挑战。

视频包含复杂的动态信息,人工智能更难处理这些信息,不仅需要更多的计算能力,而且如何设计最佳 AI 视频解读系统,也存在诸多困难。

在视频处理方面,研究人员发现,保持每秒恒定的帧采样率能获得最佳结果。因此 Apollo 模型使用两个不同的组件,一个处理单独的视频帧,而另一个跟踪对象和场景如何随时间变化。

此外,在处理后的视频片段之间添加时间戳,有助于模型理解视觉信息与文本描述之间的关系,保持时间感知。

Meta 推出 Apollo 开源模型,让 AI “看懂”视频

在模型训练方面,团队研究表明训练方法比模型大小更重要。Apollo 模型采用分阶段训练,按顺序激活模型的不同部分,比一次性训练所有部分效果更好。

Meta 推出 Apollo 开源模型,让 AI “看懂”视频

此外 Meta 公司还不断优化数据组合,发现 10~14% 的文本数据,其余部分略微偏向视频内容,可以更好地平衡语言理解和视频处理能力。

Meta 推出 Apollo 开源模型,让 AI “看懂”视频

Apollo 模型在不同规模上均表现出色,较小的 Apollo-3B 超越了 Qwen2-VL 等同等规模的模型,而 Apollo-7B 超过更大参数的同类模型,Meta 已开源 Apollo 的代码和模型权重,并在 Hugging Face 平台提供公开演示。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-12-19 12:45:02

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

火山引擎发布大模型训练视频预处理方案 已应用于豆包
10月15日消息,火山引擎在视频云技术大会上发布了大模型训练视频预处理方案。目前,该技术方案已应用于豆包视频生成模型。火山引擎总裁谭待在活动致辞表示,在AIGC、多模态等技术的共
2024-10-15 15:07:00
开源社区参数量最大的文生视频模型来了,腾讯版Sora免费使用
...又多了一个选择!今日,腾讯宣布旗下的混元视频生成大模型(HunYuan-Video )对外开源,模型参数量 130 亿
2024-12-04 09:48:00
支持1024帧、准确率近100%,英伟达「LongVILA」开始发力长视频
现在,长上下文视觉语言模型(VLM)有了新的全栈解决方案 ——LongVILA,它集系统、模型训练与数据集开发于一体。现阶段,将模型的多模态理解与长上下文能力相结合是非常重要的,
2024-08-22 09:51:00
OpenAI发布文生视频模型Sora,奥尔特曼选取网友提示词
...凌晨,OpenAI再次扔出一枚深水炸弹,发布了首个文生视频模型Sora。据介绍,Sora可以直接输出长达60秒的视频
2024-02-16 18:44:00
meta推出“v-jepa”视频预测模型
...YannLeCun在2022年推出了JEPA(JointEmbeddingPredictiveArchitectures)模型架构
2024-02-18 04:39:00
智谱AI发布视频生成大模型,B站参与研发,亦庄提供算力|甲子光年
视频大模型进入百模大战。今年是“视频生成”大模型爆发元年。在过去两个月,我们看到了快手可灵、商汤Vimi、Luma AI
2024-07-27 09:30:00
GR-2登场!ByteDance Research提出机器人大模型,具备世界建模
最近,ByteDance Research 的第二代机器人大模型 —— GR-2,终于放出了官宣视频和技术报告。GR-2 以其卓越的泛化能力和多任务通用性
2024-10-10 09:57:00
Sora这就落伍了?Meta“最强视频模型”不用DiT,用Llama大力出奇迹了
...量问题而导致难产的节骨眼,Meta毫不客气发了它的视频模型“Movie Gen”,并直接用一个完整的评测体系宣告自己打败了Sora们
2024-10-08 09:51:00
4090单卡可跑,6秒直出电影级画质,智谱版Sora正式开源!
...视频数就已经破百万。并且,智谱AI也将同源的视频生产模型CogVideoX,一并开源了。7月26日,智谱发布AI 生视频产品「清影」
2024-08-07 09:43:00
更多关于科技的资讯:
第四届福建(南安)厨卫展、第22届南安卫浴五金展在南安同期举行
3月31日至4月3日,第四届福建(南安)厨卫展、第22届南安卫浴五金展在南安同期举行。一个行业,同时在一地举办两场展会
2026-04-15 14:04:00
中新经纬4月15日电 苹果公司官方微信号15日向用户发布提示,更新iOS以保护iPhone免受网页攻击。提示称,安全研究人员最近发现
2026-04-15 11:06:00
当前,Cos委托、秒回师、虚拟恋人、电子宠物、电子父母、AI陪聊等新型陪伴形式兴起,从线上到线下,回应着年轻人的情绪需求和期待
2026-04-15 13:07:00
龙敏飞近年来,随着社会结构变迁、观念转变、技术发展,Cos委托、秒回师、虚拟恋人、电子宠物、电子父母、AI陪聊等新型陪伴形式逐渐兴起
2026-04-15 13:53:00
对话苏州市青年新锐设计师|潘磊:创作的理性思考,建造的物性再现
建筑不只关于形式,还关于氛围;不只关于视觉,还关于体验。让空间本身说话,——这是潘磊坚持的设计理念,也是他所说的“创作的理性思考
2026-04-15 13:53:00
中新经纬4月15日电 据美联社报道,华特迪士尼公司当地时间14日开始裁员,预计将影响1000人。报道称,2月份新上任的公司首席执行官Josh D'Amaro在1月份合并迪士尼营销部门后宣布了进一步裁员
2026-04-15 08:20:00
4月13日,在太原海纳辰科仪器仪表有限公司的生产车间内,技术人员正紧盯操作屏,对即将出厂的HN-CK6000环境噪声自动监测系统进行最后调试
2026-04-15 08:24:00
浙江日报讯 (记者 李洁薇 通讯员 市闻) 近日,宁波镇海炼化基地二期现场,一座3000立方米的巨型球罐外,几名技术人员紧盯操控屏幕
2026-04-15 08:29:00
文案:靳彤 曹秦雨 制作:刘昀
2026-04-15 08:29:00
厦门网讯(厦门日报记者 沈彦彦)经典影像品牌柯达将以全新潮流姿态登陆鹭岛——轻户外潮流生活方式品牌KODAK Apparel福建首店近日官宣入驻厦门万象城二期
2026-04-15 08:56:00
菜鸟发布攀爬机器人ZeeBot 实测智能化存取效率提升一倍
2026年4月15日,菜鸟集团在美国亚特兰大举行的MODEX 2026国际物流展上发布了首款自研的“攀爬机器人”ZeeBot
2026-04-15 10:22:00
探馆寻“码”!你我都是数字守“密”人丨e法豫说
大河网讯(记者 董蕾 李思豫)当蓝牙连接、共享充电、App授权成为日常,当万物互联成为时代的底色,我们比任何时候都更清晰地认识到
2026-04-15 10:32:00
重磅!方正印捷与宏贤达集团达成880喷墨设备合作,共筑图书POD生态
4月10日,方正印捷与北京宏贤达物流集团有限公司旗下宏贤达(固安)数码印刷有限公司在河北固安举办印刷设备采购签约仪式。双方正式签署协议
2026-04-15 08:51:00
浙江日报桐庐4月14日电 (记者 张源 王柯宇 通讯员 方菲) 14日,桐庐县富春轮船码头,工作人员通过手机APP预约“水上网约车”
2026-04-15 08:29:00
临沂沂河新区白沙埠镇:创新蝶变助推仪表产业智能升级
鲁网4月14日讯“近期喜讯不断,刚刚接到了一家国内上市公司1000万的接管螺母合同订单。后续的表壳订单也将看货跟进,目前产品订单已经排到了5月份
2026-04-15 08:05:00