• 我的订阅
  • 头条热搜
「See Video, Get 3D」,智源开源无标注视频学习3D生成模型See3D
... Labs 推出首个【空间智能】模型,仅输入单张图片,即可生成一个逼真的 3D 世界,这被认为是迈向空间智能的第一步。几乎同时,国内智源研究院推出了首个利用大规模无标注的互联网视频学习的 3D生成模型See3D---See Video, Get 3D...……更多
2022生成模型进展有多快,新论文盘点9类生成模型代表作
ChatGPT的出现,彻底将生成AI推向爆发。但别忘了,AI生成模型可不止ChatGPT一个,光是基于文本输入的就有7种——图像、视频、代码、3D模型、音频、文本、科学知识……尤其2022年,效果好的AI生成模型层出不穷,又以OpenAI、Meta...……更多
类Sora模型能否理解物理规律?字节豆包大模型团队系统性研究揭秘
视频生成模型虽然可以生成一些看似符合常识的视频,但被证实目前还无法理解物理规律!自从 Sora 横空出世,业界便掀起了一场「视频生成模型到底懂不懂物理规律」的争论。图灵奖得主 Yann LeCun 明确表示,基于文本提示生...……更多
Meta提出“可持续思维链”,让大模型在连续潜空间中推理
...日值得关注的大模型前沿论文北大团队提出「自定义漫画生成」框架UniReal:通过学习真实世界动态实现通用图像生成和编辑苹果团队提出「可扩展视频生成」方法利用扩散 Transformer 进行视频运动迁移ObjCtrl-2.5D:无需训练的「图...……更多
首个3d人像视频生成模型来了
...。眨个眼、动动嘴,都是小case~最近AIGC爆火,3D人像模型生成这边也没闲着。 如StyleNerf、StyleSDF、EG3D等方法相继出世。但到目前为止,这种生成模型都还停留在单帧人像上。最近,来自新加坡国立大学(NUS)和字节跳动的研究...……更多
文生视频让自动驾驶看到新方向
...频让自动驾驶看到新方向来源:视觉中国陈颖聪近年来,生成式人工智能在AI技术应用中成为焦点,尤其是文本生成视频大模型Sora,近来更是在全球范围内激发了科技创新的热潮。香港科技大学(广州)人工智能学领域助理教授...……更多
AI视野:Gen-2支持生成4K高清视频;Midjourney推出Style Tuner工具;
AI应用Gen-2史诗级更新 允许用户通过简单文本生成4K高清视频Runway的AI视频生成工具Gen-2经历了一次重大更新,允许用户通过简单的文本输入来生成4K高清视频,彻底改变了创意软件的方式。Midjourney推出Style Tuner工具,让用户自定...……更多
国产地表最强视频模型震惊歪果仁,官方现场摇人30s直出!视觉模型进入上下文时代
...上下文学习优势,视觉模型居然也有了。来自中国的视频生成模型,再一次震惊了全球大模型圈。生数科技推出的Vidu 1.5,成为世界首个支持多主体一致性的多模态模型!上传小哥、机甲、街景,接下来,就是见证奇迹的时刻。...……更多
视频大模型 快手美图殊途同归
...视频大模型“可灵”并开始邀测,用户输入一段文字即可生成视频。美图宣布将在7月底上线新品MOKI,该产品基于美图奇想大模型的视频生成能力,可帮助用户生成AI短片。不论是做视频还是做短片,都是通过大模型辅助用户创...……更多
谷歌DeepMind展示大模型Genie,能从零制作类似超级马里奥的游戏
OpenAI 最近公布了其令人惊叹的视频生成模型 Sora,打破了文本到视频生成模型的天花板。近日,谷歌 DeepMind 也展示了最新的文本到视频游戏的生成模型。(来源:GOOGLE DEEPMIND)这款名为 Genie 的新模型可以接受简短的文字描述、...……更多
Sora再度颠覆AI视频行业,A股哪些公司有相关布局?
...模型Sora因其“逼真”和“富有想象力”被广泛赞誉,其生成视频可达60秒也颠覆了传统视频生成领域平均只有4秒的视频生成长度。OpenAI官网介绍,Sora是一种扩散模型,它从看起来像静态噪声的视频开始生成视频,然后通过多个...……更多
更快、更强、更可控:智谱“起舞弄清影”,视频生成卷出新高度!
智谱AI再次放大招,上线AI视频生成功能“清影”——曾被国际科技媒体The Information评为最有可能成为“中国OpenAI”5家企业之一的智谱AI,如今在视频生成领域再下一城。不同于至今没有对公众开放、“犹抱琵琶半遮面”的Sora,...……更多
AIGC工具测评:生成式AI的产品表现如何
过去这一年,全球涌现出了众多生成式AI产品。在这篇文章中,我们将探讨这些工具的表现,通过实际体验和评估,为读者提供一个关于当前AI工具的全面视角。2023年,AI技术迎来了其发展史上的一次重大飞跃。随着技术突破和...……更多
OpenAI空降视频生成模型:一口气生成60s,风格画质尺寸灵活定制 | 最前线
... | 苏建勋2023年4月,成立于纽约的Runway AI发布了一段用AI生成的视频:模糊卡顿、物体扭曲,且仅4秒;四个月后,Runway将文生视频的视频效果拉到了4K的超逼着高度,实现了镜头的连贯稳定。而视频的最大长度也从4秒,提升到了1...……更多
谷歌VideoPoet大模型上线,生成长达10秒视频,还可自动配音 | 最前线
...卷”了一把对手们。12月19日,谷歌专门发了一款搞视频生成的模型VideoPoet,不仅能支持根据视频加入音频效果,允许交互编辑,更重要的是,VideoPoet现在可以生成更长的视频了。简而言之,这次的模型看起来更加全能了。看过De...……更多
把Waymo玩成GTA游戏!全生成式的车辆行驶轨迹视频合成器来了
...系报道。来自中科院自动化所的团队提出 FreeVS,一个全生成式的新视角合成方法。相较于仅能在记录的车辆行驶原轨迹上渲染高质量相机视角的基于场景重建的方法,FreeVS 能够作为生成引擎渲染真实场景中任意车辆行驶轨迹下...……更多
4090单卡可跑,6秒直出电影级画质,智谱版Sora正式开源!
...Sora「清影」,已经引起了AI视频圈的轰动!才发布6天,生成视频数就已经破百万。并且,智谱AI也将同源的视频生产模型CogVideoX,一并开源了。7月26日,智谱发布AI 生视频产品「清影」,30秒将任意文图生成视频,并上线在他们...……更多
Sora为何没能诞生在中国?
...提示框内输入“中世纪小号手”,打开音效开关键,点击生成视频,一个4秒的AI生成视频便跃然于屏幕上。人们不仅能看到一个身穿中世纪宫廷服饰乐手的画面,还能听到乐手吹小号的声音。北京时间3月10日,硅谷一家AI初创公...……更多
Sora爆火96小时国内大模型进场
...专家认为,国内企业想弯道超车难度不小查睿OpenAI“文字生成视频”大模型Sora根据提示词“纽约市像亚特兰蒂斯一样被淹没。鱼、鲸鱼、海龟和鲨鱼在纽约的街道上游弋”生成的20秒视频。 视频截图 ■Sora不仅可以理解用户的需...……更多
Sora震撼来袭,AI动画以假乱真了吗?专家:仍存硬伤
近日,博主“AI疯人院”在网络上发布了一部利用AI技术生成的《西游记》动画短片。短片中展现了错落有致的宫殿群、郁郁葱葱的花果山,还有山间云卷云舒、山石崩裂等动画画面,令众多网友赞叹不已。这段短片利用了AI规...……更多
华为云盘古大模型5.0发布:可控时空生成技术重塑自动驾驶开发
...HDC 2024)上,华为云发布了盘古大模型5.0,其创新的多模态生成能力,可以为自动驾驶领域提供更高质量的数据支持。华为常务董事、华为云CEO张平安表示,盘古5.0通过创新的可控时空生成,大规模的生成和实际场景相一致的驾驶...……更多
开源社区参数量最大的文生视频模型来了,腾讯版Sora免费使用
...小伙伴又多了一个选择!今日,腾讯宣布旗下的混元视频生成大模型(HunYuan-Video )对外开源,模型参数量 130 亿,可供企业与个人开发者免费使用。目前该模型已上线腾讯元宝 APP,用户可在 AI 应用中的「AI 视频」板块申请试用...……更多
ECCV 2024 | 南洋理工三维数字人生成新范式:结构扩散模型
...和国内外知名高校、科研机构广泛开展合作。三维数字人生成和编辑在数字孪生、元宇宙、游戏、全息通讯等领域有广泛应用。传统三维数字人制作往往费时耗力,近年来研究者提出基于三维生成对抗网络(3D GAN)从 2D 图像中...……更多
“Sora目前仍不够可靠,应用场景受限”
近日,博主“AI疯人院”在网络上发布了一部利用AI技术生成的《西游记》动画短片。短片中展现了错落有致的宫殿群、郁郁葱葱的花果山,还有山间云卷云舒、山石崩裂等动画画面,令众多网友赞叹不已。这段短片利用了AI规...……更多
NeurIPS | 消除多对多问题,清华大规模细粒度视频片段标注新范式
...自动细粒度视频标注系统 VERIFIED(图 1 (c)),通过大模型生成富含静态和动态信息的标注,并且基于微调 video foundation model 设计了一个高效的标注质量评估模块,基于此构建了 Charades-FIG、DiDeMo-FIG 和 ActivityNet-FIG 高……更多
突破次元壁!新加坡国立发布GenXD:拿捏真实感3D、4D动态场景
...智元导读】GenXD模型结合CamVid-30K数据集突破了3D和4D场景生成的挑战,能从单张图片生成逼真的动态3D和4D场景。这一进展为虚拟世界构建带来新的可能性,让动态场景的生成更加快速和真实。在我们熟知的2D图像和视频生成技术...……更多
从AI画画到“用声音做视频”,全球掘金AIGC | 焦点分析
...了个华丽的返场——登台的新宠儿名为“AIGC”,又称“生成式AI”(Generative AI)。这一领域正以令人侧目的速度发展,将创新和技术再度拉回到世界舞台的焦点。今年4月,一家名为Open AI的公司公布旗下的DALL-E 2模型,其用文字...……更多
音频驱动人像视频模型:字节Loopy、CyberHost研究成果揭秘
近期,来自字节跳动的视频生成模型 Loopy,一经发布就在 X 上引起了广泛的讨论。Loopy 可以仅仅通过一张图片和一段音频生成逼真的肖像视频,对声音中呼吸,叹气,挑眉等细节都能生成的非常自然,让网友直呼哈利波特的魔...……更多
年度生成式AI大会上海站公布最新嘉宾,报名进入最后阶段
2024年已行进尾声,但对于生成式AI而言,这又是波澜壮阔的一年。Sora掀起视频生成热潮,多模态世界模型的研究热度渐起。更具革命性的推理模型o1悄然出世,带来的思维链CoT+强化学习这一新范式,正推动生成式AI迈入新的阶...……更多
Runway开发通用世界模型,想让AI更好地模拟世界
...1.0版本,并宣布融资千万美金,出尽风头。而作为AI视频生成的老大哥,现象级产品Gen-1、Gen-2的开发商Runway突然宣布组建团队开发通用世界模型(General World Models,以下简称GWMs),目标是创建一种不同于大语言模型的,并能模拟...……更多
更多关于科技的资讯:
《阿凡达3:火与灰》12月19日上映!卡梅隆:试映反馈良好 绝对是三部里最好的一部!
快科技2月23日消息,《阿凡达》是有史以来全球票房最高的电影,詹姆斯·卡梅隆却说,第三部可能是迄今为止最好的。近日,传好莱坞奇导演詹姆斯·卡梅隆 (James Cameron)接受新西兰媒体Stuff采访时透露
2025-02-23 17:31:00
高铁乘务员小姐姐怎么总看“手机”:原来有5大功能
快科技2月23日消息,经常坐高铁的话,你肯定注意到了,乘务员小姐姐或者小哥哥会经常盯着一台看着像手机又不像手机的设备,这是什么呢
2025-02-23 18:01:00
医生称DeepSeek有三甲医院专家水平:可帮忙诊断超复杂脑瘤
快科技2月23日消息,据报道,北京某医院神经外科主任医师分享了一段使用DeepSeek辅助诊断复杂脑瘤患者的经历,并对DeepSeek的表现给予了高度评价
2025-02-23 18:01:00
仰望U8同级!猛士917L长轴距版曝光:现款63.77万起
快科技2月23日消息,东风猛士科技计划在今年上半年发布猛士917L长轴距版高定车型,同时将在下半年推出与华为合作的全新智电越野产品
2025-02-23 18:01:00
前波士顿动力研究所展示智能自行车UMV:跑酷轻松跳上桌
快科技2月23日消息,近期,机器人领域可谓热闹非凡。中国宇树机器人凭借其灵巧的身姿和强大的运动能力,在国内外掀起一股热潮
2025-02-23 18:31:00
105公里、速度提升4760倍!中国量子直接通信迈向实用
快科技2月23日消息,最近,北京量子信息科学研究院与清华大学、北方工业大学合作,提出单向量子直接通信理论,并成功研制出实用化系统
2025-02-23 18:31:00
蔚来乐道:L90最快将于2季度亮相 3季度上市
快科技2月23日消息,乐道汽车宣布其第二款车型,旗舰产品乐道L90 SUV,专为大家庭设计的“大三排”车型,计划最快于2025年第二季度亮相
2025-02-23 18:31:00
小鹏汽车:计划2025年进入60个国家和地区
快科技2月23日消息,小鹏汽车宣布了其2025年的全球扩张计划,届时将进入60个国家和地区,并建立超过300个海外售后服务网点
2025-02-23 19:01:00
AMD RX 9070 XT理论跑分首曝:居然逼近RX 7900 XTX!
快科技2月23日消息,AMD RX 9070系列显卡即将在本月底正式发布,3月5日解禁、6日上市开卖,现在我们看到了第一份理论跑分
2025-02-23 19:01:00
价格不到国内三分之一,医美“特种兵”涌向韩国
原标题 | 价格不到国内三分之一,医美“特种兵”涌向韩国精打细算的打工人们,正在捧热“特种兵式轻医美”。在上海工作的王敏
2025-02-23 20:48:00
厉害了!智慧医疗新突破!吉大一院成功完成DeepSeek本地化部署
近年来,在国家大力推动“人工智能+医疗”深度融合的宏观背景下,医疗大模型凭借强大的自然语言理解、推理能力及多模态处理性能
2025-02-23 19:38:00
AMD RX 7650 GRE显卡价格松动了:1979元就能到手
快科技2月23日消息,AMD日前发布了新款中国特供显卡RX 7650 GRE,官方定价2049元起,叠加首发优惠到手价1999元起
2025-02-23 20:32:00
这个日本男人 结婚前才发现:未婚妻已65岁!比他大了25岁
这个男人叫Yoshitaka,2014年,他因为离婚经常在一家酒吧借酒消愁。时间长了,他就和酒吧老板娘Aki认识了,两人的经历很相似
2025-02-23 21:02:00
一图速读2025年中央一号文件“关键词”
编辑:黄灵责编:廖异 审核:阮鹏程
2025-02-23 21:56:00
江南时报讯 近日,在2025年苏州市“人工智能+”创新发展推进大会上,常熟农商银行自主研发的新市民信用评分模型成功入选苏州市级培育人工智能大模型名单
2025-02-23 21:58:00