• 我的订阅
  • 科技

Meta 推出 Apollo 开源模型,让 AI “看懂”视频

类别:科技 发布时间:2024-12-19 09:31:00 来源:IT之家

IT之家 12 月 18 日消息,Meta 携手斯坦福大学,推出全新 AI 模型系列 Apollo,显著提升机器对视频的理解能力。

IT之家注:尽管人工智能在处理图像和文本方面取得了巨大进步,但让机器真正理解视频仍然是一个重大挑战。

视频包含复杂的动态信息,人工智能更难处理这些信息,不仅需要更多的计算能力,而且如何设计最佳 AI 视频解读系统,也存在诸多困难。

在视频处理方面,研究人员发现,保持每秒恒定的帧采样率能获得最佳结果。因此 Apollo 模型使用两个不同的组件,一个处理单独的视频帧,而另一个跟踪对象和场景如何随时间变化。

此外,在处理后的视频片段之间添加时间戳,有助于模型理解视觉信息与文本描述之间的关系,保持时间感知。

Meta 推出 Apollo 开源模型,让 AI “看懂”视频

在模型训练方面,团队研究表明训练方法比模型大小更重要。Apollo 模型采用分阶段训练,按顺序激活模型的不同部分,比一次性训练所有部分效果更好。

Meta 推出 Apollo 开源模型,让 AI “看懂”视频

此外 Meta 公司还不断优化数据组合,发现 10~14% 的文本数据,其余部分略微偏向视频内容,可以更好地平衡语言理解和视频处理能力。

Meta 推出 Apollo 开源模型,让 AI “看懂”视频

Apollo 模型在不同规模上均表现出色,较小的 Apollo-3B 超越了 Qwen2-VL 等同等规模的模型,而 Apollo-7B 超过更大参数的同类模型,Meta 已开源 Apollo 的代码和模型权重,并在 Hugging Face 平台提供公开演示。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-12-19 12:45:02

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

火山引擎发布大模型训练视频预处理方案 已应用于豆包
10月15日消息,火山引擎在视频云技术大会上发布了大模型训练视频预处理方案。目前,该技术方案已应用于豆包视频生成模型。火山引擎总裁谭待在活动致辞表示,在AIGC、多模态等技术的共
2024-10-15 15:07:00
开源社区参数量最大的文生视频模型来了,腾讯版Sora免费使用
...又多了一个选择!今日,腾讯宣布旗下的混元视频生成大模型(HunYuan-Video )对外开源,模型参数量 130 亿
2024-12-04 09:48:00
支持1024帧、准确率近100%,英伟达「LongVILA」开始发力长视频
现在,长上下文视觉语言模型(VLM)有了新的全栈解决方案 ——LongVILA,它集系统、模型训练与数据集开发于一体。现阶段,将模型的多模态理解与长上下文能力相结合是非常重要的,
2024-08-22 09:51:00
OpenAI发布文生视频模型Sora,奥尔特曼选取网友提示词
...凌晨,OpenAI再次扔出一枚深水炸弹,发布了首个文生视频模型Sora。据介绍,Sora可以直接输出长达60秒的视频
2024-02-16 18:44:00
meta推出“v-jepa”视频预测模型
...YannLeCun在2022年推出了JEPA(JointEmbeddingPredictiveArchitectures)模型架构
2024-02-18 04:39:00
智谱AI发布视频生成大模型,B站参与研发,亦庄提供算力|甲子光年
视频大模型进入百模大战。今年是“视频生成”大模型爆发元年。在过去两个月,我们看到了快手可灵、商汤Vimi、Luma AI
2024-07-27 09:30:00
GR-2登场!ByteDance Research提出机器人大模型,具备世界建模
最近,ByteDance Research 的第二代机器人大模型 —— GR-2,终于放出了官宣视频和技术报告。GR-2 以其卓越的泛化能力和多任务通用性
2024-10-10 09:57:00
Sora这就落伍了?Meta“最强视频模型”不用DiT,用Llama大力出奇迹了
...量问题而导致难产的节骨眼,Meta毫不客气发了它的视频模型“Movie Gen”,并直接用一个完整的评测体系宣告自己打败了Sora们
2024-10-08 09:51:00
4090单卡可跑,6秒直出电影级画质,智谱版Sora正式开源!
...视频数就已经破百万。并且,智谱AI也将同源的视频生产模型CogVideoX,一并开源了。7月26日,智谱发布AI 生视频产品「清影」
2024-08-07 09:43:00
更多关于科技的资讯:
“杭州六小龙”之一、机器人研发生产行业领军企业布局未来之城雄安云深处科技有限公司成立河北新闻网讯(河北日报记者李畅)4月8日
2026-04-14 08:12:00
华为正式官宣Pura90系列发布会将于4月20日举办。与此同时,RedmiK系列迭代产品、一加中端新机等消息持续释放,令4月手机市场提前步入预热高峰
2026-04-14 08:12:00
如今,生成式AI广泛应用,迭代迅速,给生活带来了不小的改变。技术普及大幅降低了生成式AI的使用门槛,从AI视频生成到AI聊天陪伴
2026-04-14 08:12:00
探访卓越级智能工厂①|262台机器人“打工”,一键“智”炼绿钢
262台机器人“打工”,一键“智”炼绿钢——探访卓越级智能工厂之一编者按 智能工厂是智能制造的主要载体。从2024年起
2026-04-14 08:15:00
与新一代信息技术深度融合秦皇岛智慧消防产业助力创造“雄安质量”河北新闻网讯(河北日报记者孙也达)4月7日,秦皇岛泰和安科技有限公司技术室内
2026-04-14 08:15:00
厦门网讯(厦门日报记者 沈彦彦)厦门将添一家华南首店!近日,高端手工巧克力品牌特诺绮(TENUCH)华南首店正式落户厦门万象城二期
2026-04-14 08:38:00
浙江日报海口4月13日电 (记者 来逸晨 夏丹) 第六届中国国际消费品博览会13日在海南海口举行,记者在浙江交易团特设的“浙江形象展区”转了几圈
2026-04-14 08:39:00
中新经纬4月14日电 据彭博社报道,好莱坞明星联合反对派拉蒙与华纳交易。报道称,包括好莱坞明星在内的超过1000名演员
2026-04-14 08:47:00
河北新闻网讯(张纳军)4月3日,开滦股份吕家坨矿组织技术交流指导会,帮助一线单位更科学地使用和维护机电设备,推动以机保产
2026-04-14 09:34:00
牢记嘱托开新局 日新江淮往前赶|探访合肥智能机器人“大学” 打造长三角具身智能创新高地
大皖新闻讯 在合肥,一座特殊的“大学”正在加速运转。它的学员不是普通的学生,而是形态各异的智能机器人;它的课程不是数理化
2026-04-14 10:27:00
编者按福建省“十五五”规划纲要提出,实施先进制造业集群发展专项行动,加快建设“555X”产业集群,推动形成万亿立柱、千亿提升
2026-04-14 09:00:00
4月13日,马超穿着企业的文化衫,来到城市阳台。他从包里掏出了一个比鸡蛋还小的纽扣设备,他叫它“点一机”。马超是来推广它的
2026-04-14 08:09:00
4月11日,江西特种电机股份有限公司(以下简称“江特电机”)发布公告称,公司与院士团队及上海市浦东新区院士专家工作站联合会签署合作协议
2026-04-14 07:09:00