模型,视频,模型,研究人员,人员,研究头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

meta推出“v-jepa”视频预测模型

...高效预测生成图片/视频中被遮蔽的部分。IT之家注意到，研究人员使用一系列经过遮蔽处理的特定视频训练I-JEPA/V-JEPA模型，研究人员要求模型利用“抽象方式”填充视频中缺失的内容，从而让模型在填充间学习场景，进一步预...……更多

2024-02-18 04:39:00模型,视频,模型,研究人员,人员,研究

迎战GPT-4V！谷歌PaLI-3视觉语言模型问世，更小、更

...模型与相似的体积大 10 倍的模型相比具有显著竞争力。研究人员使用分类目标预训练的视觉变换器（ViT）模型与对比性预训练的模型（SigLIP）进行了比较，结果发现，PaLI-3 虽然在标准图像分类基准上略微表现不佳，但基于 SigLIP...……更多

2023-10-17 16:31:00更快,模型,视觉,语言,训练,模型

谷歌推出“文生视频”扩散模型

.../24FPS下约3.34秒视频），虽然这一数据看起来很短，不过研究人员提到，5秒视频长度实际上“已经超过大多数媒体作品中的平均镜头时长”。除了应用“Space-TimeU-Net”基础架构外，谷歌还介绍了Lumiere的基础特性，该AI建立在一个...……更多

2024-01-29 11:15:00文生,模型,视频,视频,生成,模型

行业报告 | 2023年9月全球AIGC行业月报-要闻篇

...毁模型\"技术，抵制大型AI模型的恶意应用斯坦福大学的研究人员最近推出一项创新性研究，旨在防止大型AI模型被恶意应用于有害任务。他们提出了一种名为“自毁模型”的新技术，通过这一方法，即使大型模型是开源的，也可...……更多

2023-10-18 10:00:00行业,月报,行业报告,要闻,报告,全球

deepmind开发音乐创作工具dreamtrack

...，声称可令视频创作者“更有效率地将想法变为作品”。研究人员介绍了当前通过AI模型生成音乐的挑战，这是因为音乐本身包含极高的信息密度，其中每一秒钟都可能拥有多个节拍、音符及和声。而这也使得“生成音乐”相较...……更多

2023-11-21 17:02:00创作,工具,开发,音乐,生成,模型

meta推出两款基于ai的图像编辑工具

...型中，进而在视频生成和编辑中，提供更好的控制能力。研究人员指出，当前的图像编辑模型，通常会过度修改图像，或是修改不足，而EmuEdit的优势在于能够准确按照指令进行编辑。Meta使用了1000万个合成数据集训练EmuEdit，号...……更多

2023-11-20 11:38:00图像编辑,图像,工具,生成,图像,模型

科学家开发多模态音乐理解和生成大模型，兼具理解和创作音乐能力

...”刘山松表示。在调研和确定研究现状和研究目标之后，研究人员先选用 MERT、ViT 和 ViViT 这三个特征处理器，来分别处理音乐、图像和视频输入。接着，将编码器的输出引入所选用的 LLaMA2 开源大模型，让其能够理解、处理多模...……更多

2024-04-09 10:25:00模态,音乐,科学家,生成,模型,创作

微软推出全新vasa-1模型

...，最重要的是几乎没有人工痕迹，如果不细看很难发现。研究人员承认，与所有其他模型一样，该模型目前还无法妥善处理头发等非刚性元素，但整体效果要比其它同类模型要更为优秀。研究人员还表示VASA-1支持离线batch处理模...……更多

2024-04-20 02:57:00微软,模型,全新,模型,处理,研究人员

本周硅谷发生了什么？｜OpenAI推出5项更新；微软组建新的

...在运动幅度和一致性表现良好。微软集中公司内部顶尖AI研究人员力量，组建新的GenAI团队研发小模型，减少对OpenAI的依赖。Adept AI发布多模态模型Fuyu-Heavy，官方称跑分表现仅次于GPT4-V和Gemini Ultra。同时，国内大模型也有不少进...……更多

2024-01-29 09:34:00文生,硅谷,微软,模型,团队,更新

Sora为何没能诞生在中国？

...家AI初创公司Pika lab（以下简称Pika），推出自研视频生成模型的新功能，可同时生成画面和声音。此前，人们看到的所有AI生成的视频都没有声音。此功能尚未向公众开放，但足以让人见识到AI的进化之快。今年2月16日，OpenAI发布...……更多

2024-03-19 05:31:00中国,模型,生成,视频,文生,中国

字节回应“中文版Sora”：目前无法作为完善产品落地，与..

...物或物体的动作。Boximator的数据来源是WebVid-10M数据集，研究人员从中过滤出110万段动态明显的视频片段，并为其注释220万个对象的边界框，在PixelDance和ModelScope这两个模型上训练了Boximator。字节跳动的研究人员表示，目前这款模...……更多

2024-02-20 18:40:00中文,字节,落地,中文版,产品,视频

瑞士研究人员成功训练一只机器狗

近日，瑞士苏黎世联邦理工学院机器人系统实验室的研究人员成功训练了一只机器狗，使其能够利用一条腿完成开门、移动物体等任务，并依靠其他三条腿行走和保持平衡。这种“新颖的”运动方式具有潜在的应用前景，尤其...……更多

2024-02-26 03:07:00瑞士,研究人员,机器,训练,人员,成功

谷歌DeepMind展示大模型Genie，能从零制作类似超级

...看他们造出了什么。”他说。虚拟游乐场谷歌 DeepMind 的研究人员感兴趣的不仅仅是游戏生成。Genie 背后的团队致力于研究开放式学习，将人工智能控制的机器人放入虚拟环境中，通过试错（一种被称为强化学习的技术）来解决...……更多

2024-03-02 10:19:00马里,马里奥,模型,制作,视频,生成

OpenAI机器人亮相，大模型有了“肉身”，英伟达微软都有投

文｜尚恩编辑｜邓咏仪封面来源｜Figure“大模型”终于有实体了。美国时间3月13日，由OpenAI投资的机器人公司Figure发布了一段视频demo，视频里的机器人，不仅可以与人进行对话交互，理解人类的意图，而且还拥有记忆力。当工...……更多

2024-03-14 17:17:00英伟,微软,肉身,机器人,模型,机器

openai发布sora模型：支持一次性生成多机位视频

...。OpenAI称，该模型正在接受测试，只分享给了一批精选的研究人员和学者。 ……更多

2024-02-19 03:59:00成多,机位,一次性,模型,支持,视频

谷歌DeepMind推Imagen2；ChatGPT Plu

...Converge 2加速器计划。该计划面向杰出工程师、设计师、研究人员和使用人工智能重新构想世界的产品开发者。通过技术讲座、办公时间、社交活动以及与领先从业者的对话，OpenAI将一起探索在人工智能前沿建设中最重要的机遇...……更多

2023-12-17 18:40:00模型,硅谷,订阅,监督,模型,融资

瑞士研究人员展现四足机器人新技术

...报道，近日瑞士苏黎世联邦理工学院机器人系统实验室的研究人员展现了新的试验成果：训练自己的机器狗，使其利用其中一条腿来完成开门、移动物体等任务，并依靠其他三条腿来行走、保持平衡。研究人员表示，相信这种“...……更多

2024-02-25 20:07:00新技,瑞士,研究人员,机器人,新技术,机器

Sam Altman或筹数十亿美元自造AI芯片，DeepMi

...识别视觉上不同但编码相似的图像。为了解决这个问题，研究人员提出了“交错特征混合（Interleaved-MoF）”方法，该方法结合了CLIP和DINOv2特征，显著增强了视觉基础能力。在MMVP基准测试中，这种方法实现了10.7%的性能提升，同...……更多

2024-01-29 09:20:00首席,科学家,芯片,创业,科学,模型

机器人笑了，我却笑不出来

...参考资料[1]）事实上，要实现这一点很困难，这首先需要研究人员打造出一张能够实现逼真的面部肌肉运动的机器人脸，其次还要让机器人通过人工智能学习人类表情的细微差别，并迅速做出准确的反应。如何造头？与机器人E...……更多

2024-04-15 05:58:00机器人,机器,机器人,机器,面部,表情

Sora背后团队：成立不到1年，站在谷歌肩头，应届博士带队

...网站arxiv后发现，该篇原作论文是2022年12月由伯克利大学研究人员William(Bill)Peebles和纽约大学的一位研究人员谢赛宁共同发表。William(Bill)Peebles之后加入了OpenAI，领导Sora技术团队。然而，戏剧化的是，Meta的AI科学家YannLeCun……更多

2024-02-19 15:59:00肩头,背后,团队,博士,团队,架构