模型,视频,模型,研究人员,人员,研究头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

meta推出“v-jepa”视频预测模型

...高效预测生成图片/视频中被遮蔽的部分。IT之家注意到，研究人员使用一系列经过遮蔽处理的特定视频训练I-JEPA/V-JEPA模型，研究人员要求模型利用“抽象方式”填充视频中缺失的内容，从而让模型在填充间学习场景，进一步预...……更多

2024-02-18 04:39:00模型,视频,模型,研究人员,人员,研究

首个3d人像视频生成模型来了

...人像上。最近，来自新加坡国立大学（NUS）和字节跳动的研究人员，在静态3D模型的基础上，提出了首个3D人像视频生成模型：PV3D（3DmodelforPortraitVideogeneration）。PV3D的训练继承了3DGAN模型的优点，即无需动态的三维数据监督，只...……更多

2023-02-22 19:23:00人像,生成,模型,视频,生成,视频

迎战GPT-4V！谷歌PaLI-3视觉语言模型问世，更小、更

...模型与相似的体积大 10 倍的模型相比具有显著竞争力。研究人员使用分类目标预训练的视觉变换器（ViT）模型与对比性预训练的模型（SigLIP）进行了比较，结果发现，PaLI-3 虽然在标准图像分类基准上略微表现不佳，但基于 SigLIP...……更多

2023-10-17 16:31:00更快,模型,视觉,语言,训练,模型

o1金牌团队揭秘AI超越人类惊人时刻！22分完整版视频全公开

...一个推理模型，也就是会比以往「思考」得更多。在OpenAI研究人员看来，「思考」就是推理的一种最直观的方式。有时候，当被问及意大利首都是什么问题时，我们几乎不用思考，即刻就能得出答案。但有时候，涉及商业企划书...……更多

2024-09-23 09:50:00整版,金牌,团队,人类,时刻,视频

谷歌推出“文生视频”扩散模型

.../24FPS下约3.34秒视频），虽然这一数据看起来很短，不过研究人员提到，5秒视频长度实际上“已经超过大多数媒体作品中的平均镜头时长”。除了应用“Space-TimeU-Net”基础架构外，谷歌还介绍了Lumiere的基础特性，该AI建立在一个...……更多

2024-01-29 11:15:00文生,模型,视频,视频,生成,模型

新AI模型可识别运动员情绪

...者水平。德国卡尔斯鲁厄理工学院和杜伊斯堡-埃森大学研究人员在新一期人工智能领域学术期刊《知识系统》上发表论文说，他们使用真实的比赛场景而非模拟或人工合成数据来训练人工智能系统。研究人员在特定环境中录制...……更多

2024-06-26 03:17:00运动员,模型,情绪,运动,人工智能,运动员

Meta版Sora深夜横空出世，小扎放出16秒高清大片！92

...Movie Gen Video沿用了Transformer的设计，尤其借鉴了Llama 3。而研究人员引入的「流匹配」（Flow Matching），让视频在精度和细节表现上，都优于扩散模型。稍显遗憾的是，这次Meta发的也是「期货」，产品预计明年才正式向公众开放。...……更多

2024-10-08 09:52:00高清,架构,大片,细节,论文,技术

研究人员提出版权授权方案，能将艺术家风格和IP版权授权给AI

...代下的“版权授权”方案，为解决该类问题提供了方法。研究人员表示：“我们此次研究的背景是源自于网上冲浪的时候，看到很多艺术家社区呼吁抵制文字生成图像模型，因为模型剽窃能力太强了，人类创作者创作效率跟不上...……更多

2024-06-24 09:13:00版权,研究人员,艺术家,模型,风格,人员

行业报告 | 2023年9月全球AIGC行业月报-要闻篇

...自毁模型"技术，抵制大型AI模型的恶意应用斯坦福大学的研究人员最近推出一项创新性研究，旨在防止大型AI模型被恶意应用于有害任务。他们提出了一种名为“自毁模型”的新技术，通过这一方法，即使大型模型是开源的，也...……更多

2023-10-18 10:00:00行业,月报,行业报告,要闻,报告,全球

deepmind开发音乐创作工具dreamtrack

...，声称可令视频创作者“更有效率地将想法变为作品”。研究人员介绍了当前通过AI模型生成音乐的挑战，这是因为音乐本身包含极高的信息密度，其中每一秒钟都可能拥有多个节拍、音符及和声。而这也使得“生成音乐”相较...……更多

2023-11-21 17:02:00创作,工具,开发,音乐,生成,模型

meta推出两款基于ai的图像编辑工具

...型中，进而在视频生成和编辑中，提供更好的控制能力。研究人员指出，当前的图像编辑模型，通常会过度修改图像，或是修改不足，而EmuEdit的优势在于能够准确按照指令进行编辑。Meta使用了1000万个合成数据集训练EmuEdit，号...……更多

2023-11-20 11:38:00图像编辑,图像,工具,生成,图像,模型

空间智能版ImageNet来了！李飞飞吴佳俊团队出品

...而道远。HourVideo如何炼成？之所以提出HourVideo，是因为研究人员发现目前长视频理解越来越重要，而现有评估benchmark存在不足。多模态越来越卷，人们期待AI被赋予autonomous agents的类似能力；而从人类角度来看，由于人类具备处...……更多

2024-11-11 13:31:00团队,智能,空间,视频,模态,模型

下载次数破39万！CMU、Meta联合发布VQAScore文

...用于挑战和提升现有的图像生成模型。两个工具可以帮助研究人员自动评估AI模型的性能，还能通过选择最佳候选图像来实际改善生成的图像。近年来，生成式人工智能（AIGC）引发广泛关注。Midjourney、Imagen3、Stable Diffusion和Sora...……更多

2024-11-07 09:53:00文生,次数,联合,方案,模型,文生

空间智能新进展：教机器人组装家具，实现操作步骤与真实视频对齐

...PS。数据集涵盖了6大类IKEA家具，每种家具都包含完整的3D模型、组装说明书和实际组装视频。而且划分精细，拆解出的安装子步骤多达1000多个。作者介绍，该数据集首次实现了组装指令在真实场景中的4D对齐，为研究这一复杂问...……更多

2024-11-27 09:57:00新进,机器人,步骤,机器,家具,智能

机器人轻松模仿人类，还能泛化到不同任务和智能体

...帧的基础上执行各个潜在动作之后的未来视频帧。为此，研究人员选择从预训练的视频生成模型上进行微调，将条件从文本换成了潜在动作表示和FDM的重建输出。在具身智能的相关数据集上进行微调之后，研究人员观察到World M...……更多

2024-10-23 12:05:00机器人,机器,人类,任务,智能,动作

北京人工智能数据运营平台发布

...工智能研究院理事长、北京大学教授黄铁军表示，构建大模型生态首先要建立数据流通机制，推动从数据到智能的正反馈。汇聚数据超700万亿字节“如果没有开源数据集，很难想象人工智能怎样才能实现如此快速的迭代，然而，...……更多

2024-06-16 04:14:00人工智能,北京,人工,运营,智能,数据

Meta 推出 Apollo 开源模型，让 AI “看懂”视

... AI 视频解读系统，也存在诸多困难。在视频处理方面，研究人员发现，保持每秒恒定的帧采样率能获得最佳结果。因此 Apollo 模型使用两个不同的组件，一个处理单独的视频帧，而另一个跟踪对象和场景如何随时间变化。此外，...……更多

2024-12-19 09:31:00模型,视频,模型,视频,处理,训练

谷歌员工曝AI改进速度放缓，Gemini已成立新团队解决问题

...该公司希望模型性能提升的速度可以与去年相当，这促使研究人员专注于其他方法来勉强取得效果。这种情况和OpenAI的遭遇类似。此前有报道称，OpenAI模型性能提升速度有所放缓，该公司正改变技术策略来解决问题。回到谷歌本...……更多

2024-11-15 09:51:00立新,团队,员工,速度,问题,模型

科学家开发多模态音乐理解和生成大模型，兼具理解和创作音乐能力

...”刘山松表示。在调研和确定研究现状和研究目标之后，研究人员先选用 MERT、ViT 和 ViViT 这三个特征处理器，来分别处理音乐、图像和视频输入。接着，将编码器的输出引入所选用的 LLaMA2 开源大模型，让其能够理解、处理多模...……更多

2024-04-09 10:25:00模态,音乐,科学家,生成,模型,创作

微软推出全新vasa-1模型

...，最重要的是几乎没有人工痕迹，如果不细看很难发现。研究人员承认，与所有其他模型一样，该模型目前还无法妥善处理头发等非刚性元素，但整体效果要比其它同类模型要更为优秀。研究人员还表示VASA-1支持离线batch处理模...……更多

2024-04-20 02:57:00微软,模型,全新,模型,处理,研究人员

本周硅谷发生了什么？｜OpenAI推出5项更新；微软组建新的

...在运动幅度和一致性表现良好。微软集中公司内部顶尖AI研究人员力量，组建新的GenAI团队研发小模型，减少对OpenAI的依赖。Adept AI发布多模态模型Fuyu-Heavy，官方称跑分表现仅次于GPT4-V和Gemini Ultra。同时，国内大模型也有不少进...……更多

2024-01-29 09:34:00文生,硅谷,微软,模型,团队,更新

Sora为何没能诞生在中国？

...家AI初创公司Pika lab（以下简称Pika），推出自研视频生成模型的新功能，可同时生成画面和声音。此前，人们看到的所有AI生成的视频都没有声音。此功能尚未向公众开放，但足以让人见识到AI的进化之快。今年2月16日，OpenAI发布...……更多

2024-03-19 05:31:00中国,模型,生成,视频,文生,中国

Meta联合开发机器人AI模型，任务成功率达90%

...过的环境中执行任务一直是一个棘手的问题。一般来说，研究人员需要针对每个新环境对机器人进行额外的训练，这个过程既耗时又昂贵。然而，最近的一项新研究为解决这一难题带来了新的希望。美国纽约大学、Meta和机器人...……更多

2024-09-23 10:02:00成功率,机器人,模型,机器,任务,联合

一文看尽Meta开源大礼包！全面覆盖图像分割、语音、文本、表

...强。开源链接：https://github.com/facebookresearch/sam2相比SAM2，研究人员引入了额外的数据增强技术来模拟视觉相似物体和小物体，并且通过在较长的帧序列上训练模型并对「空间」和「物体指向记忆」（object pointer memory）的位置编码...……更多

2024-11-28 12:02:00一文,大礼包,大礼,安全性,语音,图像