• 我的订阅
  • 头条热搜
meta推出“v-jepa”视频预测模型
...高效预测生成图片/视频中被遮蔽的部分。IT之家注意到,研究人员使用一系列经过遮蔽处理的特定视频训练I-JEPA/V-JEPA模型,研究人员要求模型利用“抽象方式”填充视频中缺失的内容,从而让模型在填充间学习场景,进一步预...……更多
首个3d人像视频生成模型来了
...人像上。最近,来自新加坡国立大学(NUS)和字节跳动的研究人员,在静态3D模型的基础上,提出了首个3D人像视频生成模型:PV3D(3DmodelforPortraitVideogeneration)。PV3D的训练继承了3DGAN模型的优点,即无需动态的三维数据监督,只...……更多
迎战GPT-4V!谷歌PaLI-3视觉语言模型问世,更小、更快、更强
...模型与相似的体积大 10 倍的模型相比具有显著竞争力。研究人员使用分类目标预训练的视觉变换器(ViT)模型与对比性预训练的模型(SigLIP)进行了比较,结果发现,PaLI-3 虽然在标准图像分类基准上略微表现不佳,但基于 SigLIP...……更多
o1金牌团队揭秘AI超越人类惊人时刻!22分完整版视频全公开
...一个推理模型,也就是会比以往「思考」得更多。在OpenAI研究人员看来,「思考」就是推理的一种最直观的方式。有时候,当被问及意大利首都是什么问题时,我们几乎不用思考,即刻就能得出答案。但有时候,涉及商业企划书...……更多
谷歌推出“文生视频”扩散模型
.../24FPS下约3.34秒视频),虽然这一数据看起来很短,不过研究人员提到,5秒视频长度实际上“已经超过大多数媒体作品中的平均镜头时长”。除了应用“Space-TimeU-Net”基础架构外,谷歌还介绍了Lumiere的基础特性,该AI建立在一个...……更多
...者水平。德国卡尔斯鲁厄理工学院和杜伊斯堡-埃森大学研究人员在新一期人工智能领域学术期刊《知识系统》上发表论文说,他们使用真实的比赛场景而非模拟或人工合成数据来训练人工智能系统。研究人员在特定环境中录制...……更多
Meta版Sora深夜横空出世,小扎放出16秒高清大片!92页论文曝光技术细节,Llama 3架构立功
...Movie Gen Video沿用了Transformer的设计,尤其借鉴了Llama 3。而研究人员引入的「流匹配」(Flow Matching),让视频在精度和细节表现上,都优于扩散模型。稍显遗憾的是,这次Meta发的也是「期货」,产品预计明年才正式向公众开放。...……更多
研究人员提出版权授权方案,能将艺术家风格和IP版权授权给AIGC模型
...代下的“版权授权”方案,为解决该类问题提供了方法。研究人员表示:“我们此次研究的背景是源自于网上冲浪的时候,看到很多艺术家社区呼吁抵制文字生成图像模型,因为模型剽窃能力太强了,人类创作者创作效率跟不上...……更多
行业报告 | 2023年9月全球AIGC行业月报-要闻篇
...自毁模型"技术,抵制大型AI模型的恶意应用斯坦福大学的研究人员最近推出一项创新性研究,旨在防止大型AI模型被恶意应用于有害任务。他们提出了一种名为“自毁模型”的新技术,通过这一方法,即使大型模型是开源的,也...……更多
deepmind开发音乐创作工具dreamtrack
...,声称可令视频创作者“更有效率地将想法变为作品”。研究人员介绍了当前通过AI模型生成音乐的挑战,这是因为音乐本身包含极高的信息密度,其中每一秒钟都可能拥有多个节拍、音符及和声。而这也使得“生成音乐”相较...……更多
meta推出两款基于ai的图像编辑工具
...型中,进而在视频生成和编辑中,提供更好的控制能力。研究人员指出,当前的图像编辑模型,通常会过度修改图像,或是修改不足,而EmuEdit的优势在于能够准确按照指令进行编辑。Meta使用了1000万个合成数据集训练EmuEdit,号...……更多
空间智能版ImageNet来了!李飞飞吴佳俊团队出品
...而道远。HourVideo如何炼成? 之所以提出HourVideo,是因为研究人员发现目前长视频理解越来越重要,而现有评估benchmark存在不足。多模态越来越卷,人们期待AI被赋予autonomous agents的类似能力;而从人类角度来看,由于人类具备处...……更多
下载次数破39万!CMU、Meta联合发布VQAScore文生图优化方案:Imagen3已采用
...用于挑战和提升现有的图像生成模型。两个工具可以帮助研究人员自动评估AI模型的性能,还能通过选择最佳候选图像来实际改善生成的图像。近年来,生成式人工智能(AIGC)引发广泛关注。Midjourney、Imagen3、Stable Diffusion和Sora...……更多
空间智能新进展:教机器人组装家具,实现操作步骤与真实视频对齐
...PS。数据集涵盖了6大类IKEA家具,每种家具都包含完整的3D模型、组装说明书和实际组装视频。而且划分精细,拆解出的安装子步骤多达1000多个。作者介绍,该数据集首次实现了组装指令在真实场景中的4D对齐,为研究这一复杂问...……更多
机器人轻松模仿人类,还能泛化到不同任务和智能体
...帧的基础上执行各个潜在动作之后的未来视频帧。为此,研究人员选择从预训练的视频生成模型上进行微调,将条件从文本换成了潜在动作表示和FDM的重建输出。 在具身智能的相关数据集上进行微调之后,研究人员观察到World M...……更多
...工智能研究院理事长、北京大学教授黄铁军表示,构建大模型生态首先要建立数据流通机制,推动从数据到智能的正反馈。汇聚数据超700万亿字节“如果没有开源数据集,很难想象人工智能怎样才能实现如此快速的迭代,然而,...……更多
Meta 推出 Apollo 开源模型,让 AI “看懂”视频
... AI 视频解读系统,也存在诸多困难。在视频处理方面,研究人员发现,保持每秒恒定的帧采样率能获得最佳结果。因此 Apollo 模型使用两个不同的组件,一个处理单独的视频帧,而另一个跟踪对象和场景如何随时间变化。此外,...……更多
谷歌员工曝AI改进速度放缓,Gemini已成立新团队解决问题
...该公司希望模型性能提升的速度可以与去年相当,这促使研究人员专注于其他方法来勉强取得效果。这种情况和OpenAI的遭遇类似。此前有报道称,OpenAI模型性能提升速度有所放缓,该公司正改变技术策略来解决问题。回到谷歌本...……更多
科学家开发多模态音乐理解和生成大模型,兼具理解和创作音乐能力
...”刘山松表示。在调研和确定研究现状和研究目标之后,研究人员先选用 MERT、ViT 和 ViViT 这三个特征处理器,来分别处理音乐、图像和视频输入。接着,将编码器的输出引入所选用的 LLaMA2 开源大模型,让其能够理解、处理多模...……更多
微软推出全新vasa-1模型
...,最重要的是几乎没有人工痕迹,如果不细看很难发现。研究人员承认,与所有其他模型一样,该模型目前还无法妥善处理头发等非刚性元素,但整体效果要比其它同类模型要更为优秀。研究人员还表示VASA-1支持离线batch处理模...……更多
本周硅谷发生了什么?|OpenAI推出5项更新;微软组建新的AI团队;Googe发布文生视频模型Lumiere
...在运动幅度和一致性表现良好。微软集中公司内部顶尖AI研究人员力量,组建新的GenAI团队研发小模型,减少对OpenAI的依赖。Adept AI发布多模态模型Fuyu-Heavy,官方称跑分表现仅次于GPT4-V和Gemini Ultra。同时,国内大模型也有不少进...……更多
Sora为何没能诞生在中国?
...家AI初创公司Pika lab(以下简称Pika),推出自研视频生成模型的新功能,可同时生成画面和声音。此前,人们看到的所有AI生成的视频都没有声音。此功能尚未向公众开放,但足以让人见识到AI的进化之快。今年2月16日,OpenAI发布...……更多
Meta联合开发机器人AI模型,任务成功率达90%
...过的环境中执行任务一直是一个棘手的问题。一般来说,研究人员需要针对每个新环境对机器人进行额外的训练,这个过程既耗时又昂贵。然而,最近的一项新研究为解决这一难题带来了新的希望。美国纽约大学、Meta和机器人...……更多
一文看尽Meta开源大礼包!全面覆盖图像分割、语音、文本、表征、材料发现、密码安全性等
...强。开源链接:https://github.com/facebookresearch/sam2相比SAM2,研究人员引入了额外的数据增强技术来模拟视觉相似物体和小物体,并且通过在较长的帧序列上训练模型并对「空间」和「物体指向记忆」(object pointer memory)的位置编码...……更多
瑞士研究人员成功训练一只机器狗
近日,瑞士苏黎世联邦理工学院机器人系统实验室的研究人员成功训练了一只机器狗,使其能够利用一条腿完成开门、移动物体等任务,并依靠其他三条腿行走和保持平衡。这种“新颖的”运动方式具有潜在的应用前景,尤其...……更多
谷歌世界模型:单张图生成可玩3D世界,还要和马斯克一起做AI游戏
...计Genie 2 可以轻松快速地为各种交互式体验制作原型,使研究人员能够快速试验新环境,从而训练和测试具身 AI 智能体。下图用 Imagen 3 生成的不同图像作为 Genie 2 的提示图像,以模拟纸飞机、龙、鹰或降落伞飞行之间的差异,...……更多
字节回应“中文版Sora”:目前无法作为完善产品落地,与...
...物或物体的动作。Boximator的数据来源是WebVid-10M数据集,研究人员从中过滤出110万段动态明显的视频片段,并为其注释220万个对象的边界框,在PixelDance和ModelScope这两个模型上训练了Boximator。字节跳动的研究人员表示,目前这款模...……更多
5620亿参数!谷歌发布史上最大“通才”ai模型
周一,来自谷歌和柏林工业大学的一组人工智能研究人员推出了史上最大的视觉语言模型——PaLM-E,参数量高达5620亿(GPT-3的参数量为1750亿)。PaLM-E是迄今为止已知的最大VLM(视觉语言模型)。作为一种多模态具身VLM,它不仅...……更多
谷歌DeepMind展示大模型Genie,能从零制作类似超级马里奥的游戏
...看他们造出了什么。”他说。虚拟游乐场谷歌 DeepMind 的研究人员感兴趣的不仅仅是游戏生成。Genie 背后的团队致力于研究开放式学习,将人工智能控制的机器人放入虚拟环境中,通过试错(一种被称为强化学习的技术)来解决...……更多
“上天”“入地”“下海” AI驱动中国科学创新加速前行
...工作报告提出,要持续推进“人工智能+”行动,支持大模型广泛应用。中国工程院院士、之江实验室主任王坚表示,“人工智能不是一次工具的革命,而是一次科学革命的工具或者是科学革命性的工具。”AI技术能力的突破,正...……更多
更多关于科技的资讯:
2025上海车展闭幕:共展出1366辆车 新能源车超七成
快科技5月2日消息,今天上海车展正式官宣闭幕,此次展出总面积超过36万平方米,展出车辆1366台,其中新能源车超七成;首发车163台
2025-05-02 16:37:00
三星HBM内存难了:谷歌也计划换成美光产品
快科技5月2日消息,据报道,三星在高频宽内存(HBM)领域的处境愈发艰难。自2023年10月开始,三星就一直在努力使其HBM3E产品通过英伟达认证
2025-05-02 16:37:00
两人身穿手机“盔甲”入境被查:全身裹满iPhone、三星手机
据海关发布官微通报,近日拱北海关所属青茂海关连续查获两名旅客绑藏旧手机进境案,共查获旧手机87台。当天13时许,一名身穿黑色T恤的旅客自青茂口岸旅检现场的海关“绿色通道”进境
2025-05-02 17:07:00
山东理工精密机械:智驱创新,领航机器人核心部件
鲁网5月2日讯4月26日至28日,在山东省机器人大会暨2025智创未来机器人(无人机)梦幻展上,来自济宁太白湖新区的山东理工精密机械有限公司闪耀登场
2025-05-02 17:22:00
日本3个月前掉下水道大爷终于找到了:家属唏嘘 父亲终于“”获救”
5月2日消息,今年1月28日,日本埼玉县八潮市一路口发生大规模坍塌,一名74岁的卡车司机随驾驶车辆一同落坑被困。据日本电视台(NTV)
2025-05-02 17:37:00
章泽天罕见亮相:与杨天真在不丹徒步 犹如爱丽丝仙境
快科技5月2日消息,今日杨天真发文晒照,出现了罕见亮相的章泽天身影,两人在不丹徒步。从照片看,杨天真身着紫色运动装,章泽天穿黑色运动装
2025-05-02 18:07:00
iPhone 17e命运未卜:苹果仍在权衡是否推出
快科技5月2日消息,尽管iPhone 16e取得了成功,但iPhone 17e的前景却充满了不确定性。根据最新消息,苹果目前尚未最终决定是否发布这款新机型
2025-05-02 18:07:00
这才是真正的精通!开发者成功实现Excel中运行Linux
快科技5月2日消息,近日,开发者NSG650成功实现在Excel表格中“运行Linux”,这个名为LinuxInExcel的项目已发布在GitHub上
2025-05-02 18:37:00
五一档新片豆瓣开分:《大风杀》7.2分位列第一
快科技5月2日消息,今年五一档共有10部影片齐聚大银幕,首日全国总票房超1.84亿元。五一档新片现已豆瓣开分,白客主演的电影《大风杀》以7
2025-05-02 19:07:00
RTX 5060笔记本显卡基准测试曝光:性能提升18%
英伟达一直是图形显卡领域的佼佼者,其笔记本显卡也深受玩家喜爱。如今,预算有限的移动游戏玩家们正期待配备RTX 5060显卡的游戏笔记本
2025-05-02 19:07:00
黄仁勋:中国是一个意志坚定、能力超群的国家 AI研究者一半是中国人
快科技5月2日消息,对于中国,英伟达CEO黄仁勋直言,这是一个强大的国家,想要速胜基本不可能。“中国是一个意志坚定、能力超群的国家
2025-05-02 19:07:00
荣耀400 Pro跑分出炉:预计搭载降频版骁龙8 Gen3平台
快科技5月2日消息,近日,荣耀 400 系列新机备受关注,荣耀400 Pro现身Geekbench在线数据库,部分规格随之曝光
2025-05-02 19:37:00
比尔盖茨女儿:我父亲患有神经发育障碍性疾病 不爱社交
快科技5月2日消息,微软公司创始人比尔·盖茨的女儿菲比·盖茨在本周播出的一档播客节目中透露,自己的父亲患有“阿斯伯格综合征”
2025-05-02 20:07:00
不用海归为何要道歉!董明珠:经营企业需心无旁骛 格力是我一生追求和信念
快科技5月2日消息,今天董明珠自媒体又一次重申了董明珠的观点,格力就是她一生的追求和信念。据@董明珠自媒体 ,董明珠在讲话中表示
2025-05-02 20:37:00
2024中国车企净利润榜单:比亚迪第一封神 比后四家之和还多
快科技5月2日消息,进入4月份以后,国内各家车企也相继发布了2024年财报,有机构制作了2024年中国车企净利润排行榜
2025-05-02 20:37:00