• 我的订阅
  • 头条热搜
“3D视频版Sora”来了!
输入单个物体视频,就能获取任意拍摄视角的全视图3D动态视频了!智东西7月25日消息,昨日晚间,AI独角兽Stability AI推出其首个视频生视频(video-to-video)模型Stable Video 4D(SV4D),该模型能够将单个物体的视频输入,转换为8个...……更多
单图解锁全景视角!北大/港中文/腾讯等推出ViewCrafter | 已开源
...,可以从单张或稀疏输入图像生成精确相机可控的新视角视频。还支持场景级文生3D、图生3D、以及稀疏视角重建等应用。目前论文和代码均已开源,并提供了在线Huggingface demo供用户使用。ViewCrafter:一种新视角生成方法传统的...……更多
SIGGRAPH上首个Real-Time Live的中国团队用生成式AI创建3D世界
... CLAY 的 3D 生成技术不仅指引着业界方向,还将对图像和视频的生成起到积极作用。因为从信息熵的角度来说,你提供的信息越少,模型发挥的空间就越大。而 3D 模型化可以锚定其收敛的方向,提高图像、视频生成的可控性。不...……更多
meta、cmu联手推出6-dof视频表征方法
近日,Meta和CMU的研究人员提出了一种全新的6-DoF视频表征方法,单张RTX3090即可每秒18帧实现百万像素分辨率渲染,或将给VR带来革命性的高质量体验。最近,由Meta和卡内基梅隆大学提出的6-DoF视频表征模型——HyperReel,可能预示...……更多
南洋理工大学开发3D编辑技术MVDrag3D ,只需拖拽就能实现精准P图
...繁琐而难以实现。近年来,一部分学者利用基于 3D 高斯模型的方法提高了 3D 编辑的灵活性,但仍面临着优化时间长或过度饱和的问题,并且在实现大规模结构变化方面存在不足。相比之下,得益于图像生成模型(如 GAN 和扩散...……更多
首个3d人像视频生成模型来了
只需1张普通照片,就能合成全角度动态3D视频。眨个眼、动动嘴,都是小case~最近AIGC爆火,3D人像模型生成这边也没闲着。 如StyleNerf、StyleSDF、EG3D等方法相继出世。但到目前为止,这种生成模型都还停留在单帧人像上。最近,...……更多
视频生成大模型sora和可灵的区别在哪里?
...可能仅一线之隔。Sora之后,它的挑战者前赴后继。6月,视频生成大模型迎来又一轮新品爆发,生成式AI赛道像是“过年了”。快手可灵、LumaAI以及Runway迭代更新后的Gen-3Alpha等现象级爆品不断涌现。其中,讨论度最高的是快手自...……更多
新ai模型发布:设计圈看了心慌慌
...搬运了朱俊彦团队的新成果,一个能将2D草图一键变成3D模型的新算法,却意外引发设计圈盆友们的热烈转发讨论。配文全是“沃日”、“???”……简单来说,这个模型能让非常粗糙的简笔画,一键变成逼真3D模型。还支持实...……更多
CVPR最佳论文被生成式AI占领,清华武大华南农大上科校友获奖
...的场景运动建模方法,可用于通过静态图像生成无缝循环视频,还能实现与图像中对象的交互。这项研究来自谷歌,一作谷歌DeepMind研究员Zhengqi Li(李正奇)。最佳学生论文奖也一同公布。一篇BioCLIP: A Vision Foundation Model for the Tr...……更多
一块GPU都没用,苹果自研大模型干翻GPT-4?
...索照片,AI生成短片 开发者已经能够使用自然语言查找视频和照片。比如查询“我女儿吃芝士汉堡的照片”,苹果将提供对应的搜索结果。它应该可以更轻松地在视频中找到特定图像或确切时刻,而无需使用更通用的关键字。...……更多
外媒体验Sora:猴子长出鹦鹉尾巴,OpenAI称还有很长路要走
Sora根据彭博提供的提示词生成的视频。(00:09)有关文生视频模型Sora是否能理解人类物理世界,近期一直是讨论的热点,一段由Sora生成的视频,似乎可以作为参考。2月23日,有外媒体验后报道称,由记者提供提示词后,OpenAI帮助...……更多
AI来了,会抢走人类工作吗?
...影师,换背景、换衣服、换模特、设计生成想要的图片和视频,同步所有店铺,这些原来细碎繁琐的工作,如今都能一键完成,不仅节约了时间,更为企业节约大量人力成本。在另一家人工智能作图公司的应用平台,工作人员为...……更多
华为云盘古大模型5.0发布:可控时空生成技术重塑自动驾驶开发
...的可控时空生成,大规模的生成和实际场景相一致的驾驶视频数据,有机会重塑自动驾驶的开发。华为云盘古大模型5.0可控时空生成技术(STCG),赋予了模型理解并遵循物理规律的能力,这意味着,生成的视频不仅在视觉上逼...……更多
当Sora能做真实的3D视频,离它能设计战舰也就不远了
...地运行的ChatGPT。通过搜索PC本地的文件,分析在线流媒体视频内容,进行推理。所有推理和检索都在本地进行,不会有隐私泄露问题。2月16日,Google推出基于MoE架构的Gemini Pro 1.5,创纪录实现100万token上下文能力,拥有强多模态...……更多
openai发布sora模型:支持一次性生成多机位视频
...布了Sora模型,可以根据用户输入的文本描述,生成一段视频内容,一经公布便引发网友热议。然而,Sora的能力还不止于此。当地时间周六OpenAI研究科学家比尔・皮布尔斯(BillPeebles)在X上晒图,并表示“这是Sora一次性生成的视频...……更多
世界模型突破!极佳科技首次利用世界模型增强4D驾驶场景重建效果
...模型作为数据引擎,基于真实世界的驾驶数据合成新轨迹视频(例如变道场景)。如下图所示,DriveDreamer4D 不仅可以提升多种重建算法(PVG,S3Gaussian,Deformable-GS)的图像渲染质量,还可以提升驾驶前景(车辆)和背景(车道线)...……更多
终于拿到内测!豆包-PixelDance真是字节视频生成大杀器
...这八个字会在你的头脑中触发怎样的影像?是否与下面的视频类似?视频链接:https://mp.weixin.qq.com/s/3UuumW-tSvR86dhO6UQ-Mg提示词:火山喷发,升起巨大蘑菇云,岩浆顺着山体往下流,镜头拉近,岩浆正在火山口跳动冒出。这段 10 秒...……更多
OpenAI发布文生视频模型Sora,奥尔特曼选取网友提示词
...16日凌晨,OpenAI再次扔出一枚深水炸弹,发布了首个文生视频模型Sora。据介绍,Sora可以直接输出长达60秒的视频,并且包含高度细致的背景、复杂的多角度镜头,以及富有情感的多个角色。目前官网上已经更新了48个视频demo,在...……更多
三位电影制作人用Sora生成短片,涵盖“气球头”男人
...与六周前精心挑选的、用来宣传其最新生成式模型的演示视频相比,这些短片展示了巨大的飞跃。以下是三位电影制作人是如何做到的。(来源:SHYKIDS)《空气头》ShyKids是一个总部位于加拿大多伦多的流行乐队和电影制作团体...……更多
马斯克评OpenAI首个视频生成模型:人类认赌服输
OpenAI周四发布了首个视频生成模型Sora,并展示了几段效果炸裂的演示视频。一位X用户分享了Sora生成的一名女子在东京街头漫步的视频,并评论称:“OpenAI今天宣布了Sora,它使用混合扩散和变压器模型架构生成长达1分钟的视频...……更多
谷歌VideoPoet大模型上线,生成长达10秒视频,还可自动配音 | 最前线
...咏仪 尚恩Google又又又发布了新模型,这次是在文生/图生视频赛道又“卷”了一把对手们。12月19日,谷歌专门发了一款搞视频生成的模型VideoPoet,不仅能支持根据视频加入音频效果,允许交互编辑,更重要的是,VideoPoet现在可以...……更多
企业级SaaS架构实战(2):架构视图与视角
...略,企业将自身业务结构化表达为全面的、多维度的抽象模型,包括:业务能力、端到端的价值交付、信息和组织结构,它们之间的关系,以及它们与战略、产品、策略、项目执行、利益干系人之间的关系。 这里多了个“s”,...……更多
智谱AI发布视频生成大模型,B站参与研发,亦庄提供算力|甲子光年
视频大模型进入百模大战。今年是“视频生成”大模型爆发元年。在过去两个月,我们看到了快手可灵、商汤Vimi、Luma AI、爱诗科技Pixverse、Runway Gen-3等等视频大模型的你追我赶。但上半年的视频生成大模型公司,往往只聚焦在...……更多
OpenAI空降视频生成模型:一口气生成60s,风格画质尺寸灵活定制 | 最前线
...勋2023年4月,成立于纽约的Runway AI发布了一段用AI生成的视频:模糊卡顿、物体扭曲,且仅4秒;四个月后,Runway将文生视频的视频效果拉到了4K的超逼着高度,实现了镜头的连贯稳定。而视频的最大长度也从4秒,提升到了18秒—...……更多
第七届数字中国建设峰会聚焦新一代数字技术
...股份有限公司展台,新一代视图数据联网&AI城市之眼视频综合管理平台(以下简称“AI城市之眼”)吸引观众围观。据恒锋信息科技股份有限公司相关负责人陈榕魁介绍,“AI城市之眼”是恒锋信息打造的新一代视频图像综合智...……更多
Sora爆火96小时国内大模型进场
...认为,国内企业想弯道超车难度不小查睿OpenAI“文字生成视频”大模型Sora根据提示词“纽约市像亚特兰蒂斯一样被淹没。鱼、鲸鱼、海龟和鲨鱼在纽约的街道上游弋”生成的20秒视频。 视频截图 ■Sora不仅可以理解用户的需求,...……更多
Sora刷屏 标贝科技AI配音为音视频内容创作插上翅膀
...技网】新年伊始,OpenAI 扔出一枚重磅炸弹——发布文生视频模型 Sora。作为一款全新生成式人工智能模型, Sora能够根据文本指令创造出既逼真又富有想象力的场景,生成多种风格、不同画幅、最长为一分钟的高清视频。从OpenAI ...……更多
AI视频新战场:字节对决快手、反击Sora
...格竞争,但高性能模型仍保持付费门槛。B端市场对豆包视频大模型的接纳度有待观察,其商业变现与用户场景适配性成为主要考验。@科技新知 原创作者丨萧维 编辑丨蕨影一场由Sora引发的AI视频生成竞赛,如今迎来新的竞争者...……更多
​“看见”到“理解”傅利叶GR-1成为首台具备端到端环境感知能力的人形机器人
...见”到“理解”,人形机器人端到端环境感知技术进展》视频,该技术使得机器人不仅用“眼”看到,还可以用“脑”分析,识别可通行的区域及障碍物,为复杂环境中的导航和路径规划提供全面支持。特别是在动态环境中,端...……更多
快手“可灵”意外走红,字节紧急追赶,AI文生视频赛道竞争加剧
...表现相对“佛系”的快手。6月7日,快手突然上线了文生视频模型“可灵”(Kling),并可支持长达2分钟的视频生成。此外,与Sora至今仍在“期货”阶段相比,可灵一经公布便开放了测试,生成效果亦可圈可点。“可灵是最近圈...……更多
更多关于科技的资讯:
Steam最新调查:RTX 3060王者无敌!RTX 4060移动版第二
快科技11月3日消息,Steam 2024年10月硬件调查已经出炉,RTX 3060仍然是最为流行的显卡,RTX 4060移动版意外高居第二
2024-11-03 23:07:00
本文转自:人民网-陕西频道人民网西安11月3日电(记者李志强)11月3日,国家重大科技基础设施“先进阿秒激光设施(西安部分)”建设正式启动
2024-11-03 18:45:00
一种会让牙齿掉光的病!很多人年轻时都不重视
关于牙齿健康,世界卫生组织曾提出过一个“8020”概念,指 80 岁的老年人至少应该存留有 20 颗健康可以使用的天然牙
2024-11-03 19:07:00
给大象争取\
Happy,是“服务于”美国纽约布朗克斯动物园的一头亚洲象,五十多岁了,它在这个动物园居住了几十年。可以说,它从小就是在人类的饲养环境中
2024-11-03 19:07:00
新一代便宜主板来了!B860、B850、B840傻傻分不清
快科技11月3日消息,Intel、AMD的新一代平台都已到来,但是都只有旗舰级主板,无论是Z890还是X870E/X870都很昂贵(当然AMD更好一些还能选择上代主板)
2024-11-03 19:37:00
中国研制原子钟6000万年误差小于1秒:可支撑6G、7G通信发展
快科技11月3日消息,据报道,在中国科学院国家授时中心,安放着中国自主研制的原子钟,这是世界上目前在应用的最先进计时设备
2024-11-03 19:37:00
为什么蝙蝠可以吊着睡觉 其他动物就不行
蝙蝠可以挂着睡,最重要的原因是它们的体重足够轻。其它动物如果体重也足够轻,同时能像蝙蝠那样不费力地支撑自己倒挂,那么它们也可以倒挂着睡
2024-11-03 20:07:00
一周了 酷睿Ultra 200S在德国一颗都没卖出去!
大家都知道,德国玩家非常偏好AMD,以致于到了非常离谱的地步。德国最大的零售商MindFactory公布了最新一周的CPU处理器销量数据
2024-11-03 20:07:00
雷军今晚举行“迟到的直播”,讲述小米征战纽北的故事。雷军在直播中表示,小米15 打破了售价3999元的束缚,“3999元对我们是个心魔
2024-11-03 20:23:00
苹果2024款Macmini于10月29日发布,搭载M4/M4Pro芯片,内存16GB起步。配备M4的Macmini起售价为 4
2024-11-03 20:24:00
彭博社记者马克・古尔曼昨晚发表了最新一期的《PowerOn》时事通讯,提到苹果正在逐渐放弃“年更”式的产品发布策略。“苹果公司正在逐步放弃每年一次的产品升级周期
2024-11-03 20:29:00
realme今日宣布,真我GT7Pro首发搭载realmeUI6.0,支持4年系统更新维护。升级内容如下:流体云2.0
2024-11-03 20:30:00
据媒体报道,在ICPC(国际大学生程序设计竞赛)上,华为CEO任正非与ICPC主席、教练及获奖选手举办座谈会。任正非在会上被问到
2024-11-03 20:31:00
美商海盗船发布K70 PRO TKL磁轴机械键盘:快速触发设计
快科技11月3日消息,美商海盗船宣布,将其MGX Hyperdrive霍尔效应磁轴带入到K70 PRO TKL机械键盘
2024-11-03 20:37:00
红魔10pro预热首发,1.5k无孔全面屏
红魔官方今天为新机红魔10Pro预热,号称是全面屏史上最高分辨率。目前红魔10Pro系列已经获得入网许可,其型号是NX789J
2024-11-03 20:42:00