• 我的订阅
  • 科技

meta推出“v-jepa”视频预测模型

类别:科技 发布时间:2024-02-18 04:39:00 来源:浅语科技

2月17日消息,Meta首席AI科学家YannLeCun在2022年推出了JEPA(JointEmbeddingPredictiveArchitectures)模型架构,次年基于JEPA架构开发了一款“I-JEPA”图片预测模型,目前又推出了一款名为“V-JEPA”的视频预测模型。

meta推出“v-jepa”视频预测模型

据介绍,相关JEPA架构及I-JEPA/V-JPA模型主打“预测能力”,号称可以以“人类理解”的方式,利用抽象性高效预测生成图片/视频中被遮蔽的部分。

IT之家注意到,研究人员使用一系列经过遮蔽处理的特定视频训练I-JEPA/V-JEPA模型,研究人员要求模型利用“抽象方式”填充视频中缺失的内容,从而让模型在填充间学习场景,进一步预测未来的事件或动作,进而达到对世界更深层次的理解。

meta推出“v-jepa”视频预测模型

meta推出“v-jepa”视频预测模型

▲图源Meta官方新闻稿(下同)

研究人员表示,这种训练方法能够让模型专注于影片的高层次概念,而“不会钻牛角尖处理下游任务不重要的细节”,研究人员举例“人类观看内含树木的影片时,不会特别关心树叶的运动方式”,因此采用这种抽象概念的模型,相对于业界竞品效率更佳。

meta推出“v-jepa”视频预测模型

研究人员同时提到,V-JEPA采用一种名为“FrozenEvaluations”的设计结构,即“模型在预训练之后,核心部分不会再改变”,因此只需要在模型之上添加小型专门层即可适应新任务,具有更高普适性。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-02-18 08:45:14

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

首个3d人像视频生成模型来了
...人像上。最近,来自新加坡国立大学(NUS)和字节跳动的研究人员,在静态3D模型的基础上,提出了首个3D人像视频生成模型
2023-02-22 19:23:00
迎战GPT-4V!谷歌PaLI-3视觉语言模型问世,更小、更快、更强
...模型与相似的体积大 10 倍的模型相比具有显著竞争力。研究人员使用分类目标预训练的视觉变换器(ViT)模型与对比性预训练的模型(SigLIP)进行了比较
2023-10-17 16:31:00
o1金牌团队揭秘AI超越人类惊人时刻!22分完整版视频全公开
...一个推理模型,也就是会比以往「思考」得更多。在OpenAI研究人员看来,「思考」就是推理的一种最直观的方式。有时候,当被问及意大利首都是什么问题时,我们几乎不用思考,即刻就能
2024-09-23 09:50:00
谷歌推出“文生视频”扩散模型
.../24FPS下约3.34秒视频),虽然这一数据看起来很短,不过研究人员提到,5秒视频长度实际上“已经超过大多数媒体作品中的平均镜头时长”
2024-01-29 11:15:00
...者水平。德国卡尔斯鲁厄理工学院和杜伊斯堡-埃森大学研究人员在新一期人工智能领域学术期刊《知识系统》上发表论文说,他们使用真实的比赛场景而非模拟或人工合成数据来训练人工智能系统
2024-06-26 03:17:00
华人团队爆火instructblip抢跑看图聊天
...劣的天气因素造成的。给我介绍下这幅画进行多轮对话 研究人员表示,正是基于强大BLIP-2,才使得InstructBLIP「看」的更好
2023-05-15 20:17:00
Meta版Sora深夜横空出世,小扎放出16秒高清大片!92页论文曝光技术细节,Llama 3架构立功
...Movie Gen Video沿用了Transformer的设计,尤其借鉴了Llama 3。而研究人员引入的「流匹配」(Flow Matching)
2024-10-08 09:52:00
研究人员提出版权授权方案,能将艺术家风格和IP版权授权给AIGC模型
...代下的“版权授权”方案,为解决该类问题提供了方法。研究人员表示:“我们此次研究的背景是源自于网上冲浪的时候,看到很多艺术家社区呼吁抵制文字生成图像模型,因为模型剽窃能力太强了
2024-06-24 09:13:00
行业报告 | 2023年9月全球AIGC行业月报-要闻篇
...自毁模型"技术,抵制大型AI模型的恶意应用斯坦福大学的研究人员最近推出一项创新性研究,旨在防止大型AI模型被恶意应用于有害任务。他们提出了一种名为“自毁模型”的新技术,通过这
2023-10-18 10:00:00
更多关于科技的资讯:
12日晚,第十届中国设计智造大奖(DIA)颁奖盛典在中国美术学院良渚校区举行。第十届中国设计智造大奖征集自2024年12月12日启动
2025-12-13 07:36:00
全球首个甲骨文智能体“殷契行止” 上线 最懂甲骨文的AI来了
小程序“了不起的甲骨文”,展示甲骨文“其”的不同字形。(本组图/小程序截图)甲骨拓本甲骨文“门”字 甲骨文摹本甲骨文“马”字扫码看视频 厦门网讯 (厦门日报教育工作室首席专家 佘峥 通讯员 王志鹏)你只需往电脑上传一张甲骨图片
2025-12-12 08:28:00
厦门网讯(厦门日报记者 曾嫣艳 通讯员 曾焕滨)昨日,厦门临空经济片区场景创新平台推广暨供需对接与企业路演活动在翔安创新实验室举办
2025-12-12 08:28:00
从流程到质量:制片人为短剧工业化提供的“52集样本”
在短剧行业从 “流量争夺” 转向 “品质与流程双竞争” 的关键阶段,如何在有限周期内平衡效率、成本与成片质量,成为所有制作机构必须破解的难题
2025-12-12 08:29:00
剧想天开,造梦未来|一场关于“儿童剧人物造型”的想象力实验
儿童戏剧,是投射在少年儿童心灵舞台上的第一束光。人物造型,作为这束光中最具象、最绚烂的色彩,不仅定义角色的灵魂,更深刻影响着儿童认知世界的方式与审美情感的塑造
2025-12-12 08:29:00
聚焦“中文+职业”融合:星禾星穗在世界中文大会展示校企合作新范式
在近期举办的2025世界中文大会上,教育企业星禾星穗多维度参与,展现了其在“中文+专业/职业”领域的系统思考与实践成果
2025-12-12 08:30:00
会打拳的机器人带你触摸未来 走进国家“芯火”双创基地象屿园区孵化加速器
元启创新的人形机器人正在打拳。(元启创新 供图)厦门网讯 (厦门日报记者 吴晓菁) “灵犀,灵犀,表演一段佛山醒狮。”昨日
2025-12-12 08:59:00
“数字丝路”赋能文化出海,中国数字文化扬帆全球新蓝海
2025年12月9日下午,一场聚焦数字文化出海与青年文化交流的“共建数字丝绸之路”研讨会在上海举行。中国传媒大学经济与管理学院教授方英
2025-12-12 09:00:00
AI 眼镜似乎成了AI具身智能行业中最“靓”的仔,无论是苹果、谷歌这些大厂,还是国内的科技巨头,纷纷下场。本周二,谷歌在The Android Show活动上宣布
2025-12-12 09:10:00
近日,中国人民银行苏州市分行反洗钱科公布2025年苏州市反洗钱征文比赛评审结果,苏州人保财险撰写的《破局与重构:保险公司在反洗钱履职的实践困境与创新路径研究》一文凭借深刻的问题剖析
2025-12-12 10:46:00
为提升员工职场软实力,优化内部沟通效能,12月7日,常熟人保财险琴川学府组织开展了“赋能职场进阶,高情商沟通与协作”专题培训
2025-12-12 10:56:00
长白时评评论员 刘颂寒声称“下载App必得大额红包”,旁边又用小字解释“仅限新人或以实际情况为准”;宣称“全场5折”,又在大大的“5折”后面跟个极小的“起”字……在日常的消费中
2025-12-12 10:56:00
在当前行业竞争加剧与市场环境多变的背景下,虎丘支公司持续推动降本增效工作,这既是应对挑战的必要举措,也是实现长期稳健经营的重要保障
2025-12-12 10:58:00
劳利近日“水银体温计明年起禁产”的话题引发热议。根据国家药监局此前发布的通知,自2026年1月1日起全面禁止生产含汞体温计产品
2025-12-12 11:01:00
12月4日,常熟人保财险工会策划开展了“云赏秋韵·镜拍虞山”摄影交流分享活动,旨在通过摄影艺术提升员工的审美素养与创造力
2025-12-12 11:03:00