• 我的订阅
  • 头条热搜
meta推出“v-jepa”视频预测模型
...高效预测生成图片/视频中被遮蔽的部分。IT之家注意到,研究人员使用一系列经过遮蔽处理的特定视频训练I-JEPA/V-JEPA模型,研究人员要求模型利用“抽象方式”填充视频中缺失的内容,从而让模型在填充间学习场景,进一步预...……更多
首个3d人像视频生成模型来了
...人像上。最近,来自新加坡国立大学(NUS)和字节跳动的研究人员,在静态3D模型的基础上,提出了首个3D人像视频生成模型:PV3D(3DmodelforPortraitVideogeneration)。PV3D的训练继承了3DGAN模型的优点,即无需动态的三维数据监督,只...……更多
迎战GPT-4V!谷歌PaLI-3视觉语言模型问世,更小、更快、更强
...模型与相似的体积大 10 倍的模型相比具有显著竞争力。研究人员使用分类目标预训练的视觉变换器(ViT)模型与对比性预训练的模型(SigLIP)进行了比较,结果发现,PaLI-3 虽然在标准图像分类基准上略微表现不佳,但基于 SigLIP...……更多
o1金牌团队揭秘AI超越人类惊人时刻!22分完整版视频全公开
...一个推理模型,也就是会比以往「思考」得更多。在OpenAI研究人员看来,「思考」就是推理的一种最直观的方式。有时候,当被问及意大利首都是什么问题时,我们几乎不用思考,即刻就能得出答案。但有时候,涉及商业企划书...……更多
谷歌推出“文生视频”扩散模型
.../24FPS下约3.34秒视频),虽然这一数据看起来很短,不过研究人员提到,5秒视频长度实际上“已经超过大多数媒体作品中的平均镜头时长”。除了应用“Space-TimeU-Net”基础架构外,谷歌还介绍了Lumiere的基础特性,该AI建立在一个...……更多
...者水平。德国卡尔斯鲁厄理工学院和杜伊斯堡-埃森大学研究人员在新一期人工智能领域学术期刊《知识系统》上发表论文说,他们使用真实的比赛场景而非模拟或人工合成数据来训练人工智能系统。研究人员在特定环境中录制...……更多
华人团队爆火instructblip抢跑看图聊天
...劣的天气因素造成的。给我介绍下这幅画进行多轮对话 研究人员表示,正是基于强大BLIP-2,才使得InstructBLIP「看」的更好。最最重要的是,InstructBLIP在多个任务上实现了最先进的性能,甚至在图片解释和推理上表现优于GPT4。为...……更多
Meta版Sora深夜横空出世,小扎放出16秒高清大片!92页论文曝光技术细节,Llama 3架构立功
...Movie Gen Video沿用了Transformer的设计,尤其借鉴了Llama 3。而研究人员引入的「流匹配」(Flow Matching),让视频在精度和细节表现上,都优于扩散模型。稍显遗憾的是,这次Meta发的也是「期货」,产品预计明年才正式向公众开放。...……更多
研究人员提出版权授权方案,能将艺术家风格和IP版权授权给AIGC模型
...代下的“版权授权”方案,为解决该类问题提供了方法。研究人员表示:“我们此次研究的背景是源自于网上冲浪的时候,看到很多艺术家社区呼吁抵制文字生成图像模型,因为模型剽窃能力太强了,人类创作者创作效率跟不上...……更多
行业报告 | 2023年9月全球AIGC行业月报-要闻篇
...自毁模型"技术,抵制大型AI模型的恶意应用斯坦福大学的研究人员最近推出一项创新性研究,旨在防止大型AI模型被恶意应用于有害任务。他们提出了一种名为“自毁模型”的新技术,通过这一方法,即使大型模型是开源的,也...……更多
deepmind开发音乐创作工具dreamtrack
...,声称可令视频创作者“更有效率地将想法变为作品”。研究人员介绍了当前通过AI模型生成音乐的挑战,这是因为音乐本身包含极高的信息密度,其中每一秒钟都可能拥有多个节拍、音符及和声。而这也使得“生成音乐”相较...……更多
meta推出两款基于ai的图像编辑工具
...型中,进而在视频生成和编辑中,提供更好的控制能力。研究人员指出,当前的图像编辑模型,通常会过度修改图像,或是修改不足,而EmuEdit的优势在于能够准确按照指令进行编辑。Meta使用了1000万个合成数据集训练EmuEdit,号...……更多
空间智能版ImageNet来了!李飞飞吴佳俊团队出品
...而道远。HourVideo如何炼成? 之所以提出HourVideo,是因为研究人员发现目前长视频理解越来越重要,而现有评估benchmark存在不足。多模态越来越卷,人们期待AI被赋予autonomous agents的类似能力;而从人类角度来看,由于人类具备处...……更多
下载次数破39万!CMU、Meta联合发布VQAScore文生图优化方案:Imagen3已采用
...用于挑战和提升现有的图像生成模型。两个工具可以帮助研究人员自动评估AI模型的性能,还能通过选择最佳候选图像来实际改善生成的图像。近年来,生成式人工智能(AIGC)引发广泛关注。Midjourney、Imagen3、Stable Diffusion和Sora...……更多
空间智能新进展:教机器人组装家具,实现操作步骤与真实视频对齐
...PS。数据集涵盖了6大类IKEA家具,每种家具都包含完整的3D模型、组装说明书和实际组装视频。而且划分精细,拆解出的安装子步骤多达1000多个。作者介绍,该数据集首次实现了组装指令在真实场景中的4D对齐,为研究这一复杂问...……更多
机器人轻松模仿人类,还能泛化到不同任务和智能体
...帧的基础上执行各个潜在动作之后的未来视频帧。为此,研究人员选择从预训练的视频生成模型上进行微调,将条件从文本换成了潜在动作表示和FDM的重建输出。 在具身智能的相关数据集上进行微调之后,研究人员观察到World M...……更多
...工智能研究院理事长、北京大学教授黄铁军表示,构建大模型生态首先要建立数据流通机制,推动从数据到智能的正反馈。汇聚数据超700万亿字节“如果没有开源数据集,很难想象人工智能怎样才能实现如此快速的迭代,然而,...……更多
Meta 推出 Apollo 开源模型,让 AI “看懂”视频
... AI 视频解读系统,也存在诸多困难。在视频处理方面,研究人员发现,保持每秒恒定的帧采样率能获得最佳结果。因此 Apollo 模型使用两个不同的组件,一个处理单独的视频帧,而另一个跟踪对象和场景如何随时间变化。此外,...……更多
谷歌员工曝AI改进速度放缓,Gemini已成立新团队解决问题
...该公司希望模型性能提升的速度可以与去年相当,这促使研究人员专注于其他方法来勉强取得效果。这种情况和OpenAI的遭遇类似。此前有报道称,OpenAI模型性能提升速度有所放缓,该公司正改变技术策略来解决问题。回到谷歌本...……更多
科学家开发多模态音乐理解和生成大模型,兼具理解和创作音乐能力
...”刘山松表示。在调研和确定研究现状和研究目标之后,研究人员先选用 MERT、ViT 和 ViViT 这三个特征处理器,来分别处理音乐、图像和视频输入。接着,将编码器的输出引入所选用的 LLaMA2 开源大模型,让其能够理解、处理多模...……更多
微软推出全新vasa-1模型
...,最重要的是几乎没有人工痕迹,如果不细看很难发现。研究人员承认,与所有其他模型一样,该模型目前还无法妥善处理头发等非刚性元素,但整体效果要比其它同类模型要更为优秀。研究人员还表示VASA-1支持离线batch处理模...……更多
本周硅谷发生了什么?|OpenAI推出5项更新;微软组建新的AI团队;Googe发布文生视频模型Lumiere
...在运动幅度和一致性表现良好。微软集中公司内部顶尖AI研究人员力量,组建新的GenAI团队研发小模型,减少对OpenAI的依赖。Adept AI发布多模态模型Fuyu-Heavy,官方称跑分表现仅次于GPT4-V和Gemini Ultra。同时,国内大模型也有不少进...……更多
Sora为何没能诞生在中国?
...家AI初创公司Pika lab(以下简称Pika),推出自研视频生成模型的新功能,可同时生成画面和声音。此前,人们看到的所有AI生成的视频都没有声音。此功能尚未向公众开放,但足以让人见识到AI的进化之快。今年2月16日,OpenAI发布...……更多
Meta联合开发机器人AI模型,任务成功率达90%
...过的环境中执行任务一直是一个棘手的问题。一般来说,研究人员需要针对每个新环境对机器人进行额外的训练,这个过程既耗时又昂贵。然而,最近的一项新研究为解决这一难题带来了新的希望。美国纽约大学、Meta和机器人...……更多
一文看尽Meta开源大礼包!全面覆盖图像分割、语音、文本、表征、材料发现、密码安全性等
...强。开源链接:https://github.com/facebookresearch/sam2相比SAM2,研究人员引入了额外的数据增强技术来模拟视觉相似物体和小物体,并且通过在较长的帧序列上训练模型并对「空间」和「物体指向记忆」(object pointer memory)的位置编码...……更多
瑞士研究人员成功训练一只机器狗
近日,瑞士苏黎世联邦理工学院机器人系统实验室的研究人员成功训练了一只机器狗,使其能够利用一条腿完成开门、移动物体等任务,并依靠其他三条腿行走和保持平衡。这种“新颖的”运动方式具有潜在的应用前景,尤其...……更多
谷歌世界模型:单张图生成可玩3D世界,还要和马斯克一起做AI游戏
...计Genie 2 可以轻松快速地为各种交互式体验制作原型,使研究人员能够快速试验新环境,从而训练和测试具身 AI 智能体。下图用 Imagen 3 生成的不同图像作为 Genie 2 的提示图像,以模拟纸飞机、龙、鹰或降落伞飞行之间的差异,...……更多
字节回应“中文版Sora”:目前无法作为完善产品落地,与...
...物或物体的动作。Boximator的数据来源是WebVid-10M数据集,研究人员从中过滤出110万段动态明显的视频片段,并为其注释220万个对象的边界框,在PixelDance和ModelScope这两个模型上训练了Boximator。字节跳动的研究人员表示,目前这款模...……更多
5620亿参数!谷歌发布史上最大“通才”ai模型
周一,来自谷歌和柏林工业大学的一组人工智能研究人员推出了史上最大的视觉语言模型——PaLM-E,参数量高达5620亿(GPT-3的参数量为1750亿)。PaLM-E是迄今为止已知的最大VLM(视觉语言模型)。作为一种多模态具身VLM,它不仅...……更多
谷歌DeepMind展示大模型Genie,能从零制作类似超级马里奥的游戏
...看他们造出了什么。”他说。虚拟游乐场谷歌 DeepMind 的研究人员感兴趣的不仅仅是游戏生成。Genie 背后的团队致力于研究开放式学习,将人工智能控制的机器人放入虚拟环境中,通过试错(一种被称为强化学习的技术)来解决...……更多
更多关于科技的资讯:
□南京日报/紫金山新闻记者曹丽珍近期,金融机构2026年度秋季校园招聘大幕(以下简称秋招)开启。当前,金融行业数字化转型正在加速推进
2025-10-16 07:38:00
南报网讯(通讯员宁数轩记者马道军)10月15日,记者从市数据局了解到,由南京大数据集团牵头建设运营的南京数据要素创新中心——“宁数服”近日成功入选首批“江苏省数据产业公共示范平台”名单
2025-10-16 07:39:00
南报网讯(记者王国俊)10月13日,中国联通、中国移动、中国电信三大电信运营商相继官宣eSIM手机商用试验获批。昨天记者从南京相关运营商获悉
2025-10-16 07:39:00
千米产线“擀面皮” 火红钢坯变钢卷
以 “高智绿” 三重发力筑牢南京钢铁产业根基,探访梅钢热轧厂——千米产线“擀面皮” 火红钢坯变钢卷梅钢热轧产线厂房外景
2025-10-15 08:08:00
南报网讯(记者朱旖旎通讯员汪维)近日,栖霞区人工智能产业链新联会正式成立。这是我市首家聚焦于人工智能产业链的新联会,旨在搭建政企沟通桥梁
2025-10-15 08:08:00
厦门网讯(厦门日报记者 林露虹)10月16日—19日,2025厦门国际时尚周将在厦门中山路、鼓浪屿等文旅地标举行。本届时尚周以“自在发生”为主题
2025-10-15 08:21:00
河北日报讯(记者刘光昱)10月14日,为期3天的2025第十四届中国创新创业大赛新一代信息技术领域全国赛在雄安会展中心开赛
2025-10-15 08:24:00
“正大杯”2025年全球大学生就业创业实战大赛全国总决赛首轮赛事圆满收官
10月11日至13日,"正大杯"2025年全球大学生就业创业实战大赛全国总决赛首轮赛事在北京圆满举办。本届大赛以"创未来
2025-10-15 09:08:00
兴业银行“消保大模型智审平台”获评AIIA“2025年度人工智能金融专项优秀案例”
东南网龙岩10月14日讯(通讯员 肖夏玲)近日,在中国人工智能产业发展联盟(以下简称AIIA)、工业和信息化部新闻宣传中心
2025-10-15 09:40:00
京东11.11开场, 海外用户大件也包邮,收货更快更省
10月14日,京东11.11惊喜开放日在京举行。身处海外的华人用户,只需通过京东 APP 进入全球售平台,即可同步享受 “又好又便宜” 的购物体验
2025-10-15 09:45:00
锐志机械圆满收官PACK EXPO拉斯维加斯:聚焦纸袋包装的可持续发展
锐志机械圆满完成于9月29日至10月1日在拉斯维加斯举办的 PACK EXPO 参展工作。作为全球具有影响力的包装行业盛会之一
2025-10-15 10:08:00
百世软件推AI商品智能管理功能:一键上架,助力卖家高效出海
10月14日,百世集团旗下百世软件正式宣布,其面向海外市场的核心产品千易软件全新上线AI商品智能管理功能。该功能深度融合AI技术
2025-10-15 10:39:00
政府点单 企业接单 郑州航空港发布首批45个招商场景清单
大河网讯 近日,郑州航空港正式发布《郑州航空港区2025年第一批招商场景清单》,围绕十大产业集群系统性开放45个具体发展场景
2025-10-15 11:02:00
中国移动咪咕多部短剧获奖,闪耀2025视听中国马栏山微短剧之夜
2025年10月14日,“2025视听中国马栏山微短剧之夜”在湖南圆满落幕。此次活动由中国网络视听协会、湖南省广播电视局
2025-10-15 11:09:00
容声冰箱发布权威净味报告 IDP双净2.0技术可净化百种食材异味
鲁网10月15日讯10月14日,容声冰箱举办“开新世界杯 主动净味 领鲜11.11——容声冰箱100种净味”发布会。本次活动聚焦于现代家庭冰箱普遍面临的“异味”问题
2025-10-15 11:18:00