• 我的订阅
  • 科技

AI 3D生成天花板再拉升!清华团队炼成3D Scaling Law

类别:科技 发布时间:2024-09-21 09:46:00 来源:量子位

《黑神话·悟空》的火爆,带火的不仅是3D游戏本身,还有背后暗潮汹涌的AI 3D生成技术。

一直以来,外界对3D大模型赛道的关注度都稍逊于语言模型和视频模型。然而,全球3D大模型选手们则都在暗中较量、默默发力,从a16z押注的Yellow,到李飞飞的World Labs,3D大模型的迭代速度是没落下一点。

就在刚刚,国内3D大模型头部玩家VAST更新了旗下的大模型Tripo,是基于千万级高质量原生自有数据库训出来的那种超强版本。

而3D生成新工具的玩法也更进一步,文字、单图、多图都能作为输入。

至于几何精细度和图片还原度等方面的效果嘛,先小放一段用新工具生成3D模型的视频,大家直观感受一下:

在官宣新品之余,VAST又带来另一则重磅消息,即公司连续完成了数亿元融资,这也是3D大模型赛道的最大融资金额。

当然,融资方面的引领,也只是技术实力的展现。因为VAST的技术和应用场景,确实够顶。

快速生成无瑕疵,效果惊艳

再次拉升AI 3D天花板的模型叫做Tripo 2.0。

Tripo 2.0先在几秒内生成形状几何预览,再接着几秒内为其“贴上皮肤”,⽣成纹理及PBR。

目前Tripo 2.0已正式上线,大批网友已经开启了实测。

量子位也在第一时间凑上了热闹。

Tripo 2.0支持文生3D、单图生3D;Tripo 1.4版本也支持多图生3D。

输入一个prompt,一次能生成4个3D模型。

根据输入的不同,量子位的上手实测结果在下面分为两个部分,即:

文生3D模型 图生3D模型

Tripo 2.0文生3D模型实测

话不多说,直接先来看一波文生3D效果。

第一步,生成几何形状「动漫少女的半身形象」。

就复杂结构生成效果来看,细节还是很足的:

接下来给它贴好皮肤。

在不超过20秒的生成时间里获得精细的纹理和层次;普通水平的人工建模要达到这种细节,耗时可能要上千倍。

换一道题!用Tripo 2.0生成卡通形象的全身形象试试看。

先生成个卡通小矮人试试~

出来的效果,那是相当可爱(发出宋丹丹的声音),belike:

我们又生成了一个小怪物,并且把单个生成的模型放大来看。

360度旋转,肉眼没有发现bug和瑕疵。要知道,怪物后背密密麻麻的尖刺细节,是人工建模师的噩梦,一般都会规避这种繁复的设计,但是对tripo来说毫无压力。

加大难度,再复杂一些3D模型生成任务也同样能驾驭。

透视结构理解过去一直是生成式AI的卡点,以生图模型的手指问题为代表。3D模型空间结构极为重要,我们可以看到Tripo强大的透视结构理解能力,完美生成了复杂结构的模型任务。

最后再放个厉害的,下面这个购物车什么难度都不用多说了:

Tripo 2.0图生3D模型实测

再来看一波图生3D的效果。

单图生3D模型的算法最考察对图片的空间信息理解和还原度,这次我们横向对比一些市场的其他玩家效果。

友情提示,下面每张展示图中的最后一个3D模型,都由Tripo 2.0生成。

来,上一支玫瑰花的图生模型对比展示!

对比可以清晰看到,只有它生成的几何形状360度无死角,花朵和枝叶完整度最高:

贴图之后,在还原原图的颜色、质感这一块,也是效果最好的:

测完植物生成效果,我们又测试了无生命物体的图生模型。

丢给模型一个俄罗斯复活节彩蛋图片作为输入,Tripo 2.0的输出效果最有“浮雕感”,对比来看,纹理细节都是最精致的:

进行多次测试后,不难发现Tripo 2.0在全方位的生成表现上都有显著差异。

比如生成的PBR材质具有⾼保真度,保留了原图表⾯属性和视觉效果:

再比如,不管侧面、背面,每个面都能捕捉复杂的原图特征:

Tripo 2.0不仅生成质量让人眼前一亮,更高的可控性也是一大特点。

输入不仅支持多模态,当选择文生3D模型模式时,还支持输入负向prompt(就是不让生成模型中带有什么元素)。

对输出模型姿态的控制性也很绝。

既能自定义所生成3D模型头、腿、手臂等比例。

还能“A-pose”“T-pose”两个姿势随便选,秒秒钟设定大长腿:

AI 3D生成天花板再拉升!清华团队炼成3D Scaling Law

生成好的3D模型还可以一键绑定骨骼、风格化。

3D模型人拥有自己的乐高!更多玩法大家可以慢慢探索,欢迎大家评论区共创~

Tripo 2.0效果如此哇塞,所以——

Tripo 2.0如何炼成?

从技术上层层解剖,Tripo 2.0在实现过程中打满了一个词:3D Scaling Law。

首先,Tripo 2.0基于海量千万级3D⾼质量数据库,采⽤概率性的⽣成式建模⽅法,通过学习捕捉⼤规模数据中的⼏何和材质分布。

由此,Tripo 2.0更好地保证了输出的质量、增强了模型的鲁棒性和泛化能⼒。

其次,它采用了DiT和U-Net模型的复杂混合架构。

DiT擅⻓捕捉3D结构中的全局上下⽂和⻓距离依赖关系,而U-Net精于保留精细的细节和局部特征,Tripo 2.0正是融合了这两种架构的优势。

再者,采⽤最先进的训练算法,Tripo 2.0⼏何和材质⽣成模型均基于最先进的⼤规模流模型,拥有数⼗亿参数。

同时采⽤了guidance distillation和step distillation,通过蒸馏提⾼效率,在不牺牲质量的前提下⼤幅优化了性能。

种种技术加持下,在3D生成形状、纹理质量、细节表现、输⼊条件的遵循性以及输出多样性⽅⾯,Tripo 2.0拿下新SOTA,成为新晋“五边形”战士:

之前,Tripo 2.0背后团队还与其他团队合作,推出了一箩筐学术成果,被Siggraph、CVPR、ICLR、ECCV等顶会接收。

比如Wonder3D,通过一个跨域扩散模型生成一致性的多视图法线贴图和相应的彩色图像,然后利用一种新颖的法线融合算法快速、高质量地重建3D几何体。

与现有的基于分数蒸馏采样(SDS)的方法相比,Wonder3D在效率、一致性和细节上都有显著提升,能够在2-3分钟内完成重建。

再比如TGS:Triplane Meets Gaussian Splatting,同样被CVPR 2024收录。

这项技术利用Transformer网络和一种新颖的Triplane-Gaussian混合表示,使得从单张图片中重建3D模型变得更加高效和精确。

更多细节,感兴趣的童鞋可以自行查阅。

总之,Tripo 2.0并非一蹴而就,背后有众多技术积累。

3D世界的Scaling Law

最后,我们来正式认识一下Tripo 2.0背后的公司。

VAST,去年3月成立,是一家专注于在3D大模型研发的AI公司。

公司目标是“通过打造⼤众级别的3D内容创作⼯具,建⽴3D的UGC内容平台,让基于3D的空间成为用户体验、内容表达、提升新质⽣产⼒的关键要素。”

公开资料显示,该公司的CEO、CTO都是商汤出身:

创始人兼CEO宋亚宸,曾在商汤落地过多个从零到一的AI项目,曾参与大模型六小强之一MiniMax的创立;CTO梁鼎,清华本硕博,师从戴琼海院士,曾任商汤通用模型负责人。

AI 3D生成天花板再拉升!清华团队炼成3D Scaling Law

成立一年半以来,这家公司动作频频。

首先在今年年初,亮相了自家首个3D大模型Tripo 1.0。

Tripo 1.0参数量数十亿,用上它,从单图/文字生成3D网格模型仅需要8秒。

△3D建模经典之「牛油果扶手椅」,Tripo 1.0生成

上线半年内,Tripo 1.0全球用户生成的3D模型超过了500万个。

500万个是什么概念呢?约为全球前三大3D模型数据库总和。

到了今年3月初,VAST又联合Stable Diffusion背后的Stability AI,共同推出了开源的3D基础模型TripoSR。

因其能够达成“0.5秒完成单图生成3D模型”的成就,在3D生成领域的开源届广受欢迎,至今GitHub上揽星4.3k。

AI 3D生成天花板再拉升!清华团队炼成3D Scaling Law

现在,Tripo 2.0又问世了,已经在线可玩。

得益于3D Scaling Law带来的效果提升,Tripo的这三次更新时间跨度仅仅有9个月。

而且有速度也有质量,效果在业内外颇受认可。

拿一则新消息来佐证一下:不久前,世界最大在线游戏开发平台Roblox官宣入局AI 3D生成,但截至目前,Tripo都是Roblox玩家最风靡的3D建模的趁手工具。

AI 3D生成天花板再拉升!清华团队炼成3D Scaling Law

接下来的VAST会带着Tripo去向什么方向?

量子位寻回的答案是,至少在技术方面,VAST会持续追寻3D生成式AI的Scaling Law研究模型规模、数据量和生成质量之间关系的基本原理,同时寻找数据、表征和模型架构的可扩展范式。

既致力于推动3D生成式AI的边界,也会不断探索更整体的(Holistic)3D生成。

就还挺令人期待的。

在语言模型和视频模型带给这个世界一点小小震撼过后,人们也希望3D生成赛道能滋养出属于自己的ChatGPT时刻。

毕竟3D的AI生成与其它AI生成赛道相比,情况比较特殊,不仅AI生成后人工二改技术难度大,如果模型效果表现不好,想要仅凭增加抽卡次数来达到满意度,不如趁早自己画(不是)。

好在3D生成行业深孚众望,一路前行着——

回顾过去的两年时间,尤其在2023年末到2024年间,3D生成技术得到了快速发展。

不仅在效果、速度方面均有提升,还实现了“效率高、成本低、创新性强和可定制性强”的特点。

技术飞快进步的同时,整个行业的人才密度都在不断增大。

国内,以VAST为代表,初创公司多来自全球知名高校和科研机构;放眼国外,AI教母李飞飞首次创业成立的空间智能公司World Labs,也着眼于3D生成世界,宣布长期目标是构建大世界模型(LWM)来感知、生成3D世界并与之交互。

众人拾柴火焰高嘛。

可以说,因为人才与技术、效果与场景的清晰和进步,现在AI 3D生成这个赛道,渐渐走进了更多人的视野之中。

而3D Scaling Law或将带来的突破性进展,似乎已经预示了人工智能领域下一个焦点的方向。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-09-21 11:45:03

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

中国也有Sora同款训练架构公司,清华班底,智谱也投了 | 36氪首发
...,也让生数科技立刻调整了战略。以往AI生成视频的长度天花板,是Runway Gen-3的18秒,如今Sora将天花板抬高到了60秒
2024-03-14 15:12:00
...可以用现成的开源模型做finetune,但目前开源模型的能力天花板仍不高。”唐家渝表示,“而拥有从0到1构建大模型能力的话,能在吸纳开源社区精华的同时,从底层更快更有效地优化
2023-06-19 09:03:00
...还不能替代大多数工作,是因为大模型还存在难以逾越的天花板。张钹表示,大模型的所有工作都是外部提示而非主动,并且在外部提示的情况下利用概率预测完成任务,而人类的工作依靠内部意图
2024-03-21 09:57:00
奔向大模型时代,第一期掘金城市沙龙「 AIGC 技术探索与应用创新」成功举办
...:内卷的大模型,拥抱变化的开发者AIGC 大模型的参数天花板在哪里?人工智能是否会取代重复性劳动......面对这些问题,作为圆桌主持人,稀土掘金江昪与一众嘉宾专家从技术、商
2023-04-21 19:00:00
“被投资的”智谱AI成了“投资人”
...模型训练算法和模型的能力边界,也就是“登山高度”的天花板。中金研报曾提到,新一轮生成式AI浪潮,对于上层应用而言机遇与挑战并存,而AI Infra作为必要的基础设施,其技术及
2024-04-03 11:12:00
...值重构方面,产品单价从千元级跃升至万元级,打开行业天花板;场景延伸方面,睡眠数据与健康管理结合,衍生慢性病预防服务(如鼾症干预、压力监测);模式创新方面,B端酒店试睡场景向C
2025-08-06 15:16:00
王小川公布最新530亿百川大模型,阿里腾讯等超150家企业已使用
...,而训练部分依然需要英伟达,中国大体顶不上,现在有天花板。“这是整个(行业)都要解决的问题。”王小川表示,B端市场需求明确、天花板不高,但面临的挑战是如何有效对接企业的私有数
2023-08-09 15:00:00
国内AI产品天花板!KismetAI与仓颉智元惊艳首发
国产版的GPTs来了!真正平替OpenAI-GPTs的国产AI神器,不限量不花一分钱,免费体验,普通人也能拥抱AI风口
2024-02-09 09:31:00
Transformer推理天花板被谷歌打破?DeepMind首席科学家亮出84页PPT,却遭LeCun反对
【新智元导读】随OpenAI爆火的CoT,已经引发了大佬间的激战!谷歌DeepMind首席科学家Denny Zhou拿出一篇ICLR 2024论文称
2024-09-21 09:43:00
更多关于科技的资讯:
厦门网讯(厦门日报记者 李晓平)日前,厦门市工业和信息化局组织开展人工智能政策资金申报工作,“真金白银”推进今年我市出台的《厦门市进一步推动人工智能产业发展若干措施》(以下简称《若干措施》)落地见效
2025-10-20 08:56:00
报告:研学旅游市场分化趋势明显 监管滞后发展
10月18日,“2025首届旅行服务大会暨交易展——‘跨界协作•链动未来’研学新生态思享会”在海南三亚保利国际会展中心举行
2025-10-20 09:30:00
西乡街道企业人才训练营走进北科瑞声探寻AI声纹新未来
10月16日,由西乡街道党群服务中心主办的“AI赋能·智汇西乡”企业人才训练营系列活动之北科瑞声参访学习在新一代产业园顺利举行
2025-10-20 09:48:00
姬源在数字化浪潮席卷全球的今天,一个特殊的群体正在悄然形成,他们就是阿尔法一代(GenerationAlpha)。这一代人正值智能手机
2025-10-20 10:49:00
2025微博V影响力大会揭晓9组大V荣誉,“尽兴分享”推动社会价值沉淀
10月18日,2025微博V影响力大会在北京・微博IN跨次元引力场隆重举行。作为微博主办的年度重磅平台级活动,此次大会以“尽兴分享
2025-10-20 10:49:00
新闻纵深·聚焦2025中国国际数字经济博览会|人工智能赋能产业升级“下半场”
阅读提示数字浪潮,奔涌而至。10月17日至19日,2025中国国际数字经济博览会在石家庄举办。这场综合性数字经济大会,不仅搭建起国际数字经济交流合作的高端平台
2025-10-20 07:35:00
聚焦2025中国国际数字经济博览会|数字“加料”,生活可以这么“潮”
10月17日,观众和下棋机器人对弈。河北日报记者 史晟全摄数字让生活更美好。2025中国国际数字经济博览会上,众多数智技术闪亮登场
2025-10-20 07:37:00
河北日报讯(记者宋平)10月19日,2025京津冀AI赋能教育新生态大会在石家庄举办。来自政府、高校、科研机构与企业的与会嘉宾
2025-10-20 07:42:00
青春华章丨制造业“数智化”,“脑力”岗位需求旺
南航双选会上来了237家制造业单位制造业“数智化”,“脑力”岗位需求旺□南京日报/紫金山新闻记者姜静实习生黄佳琪杨久久400多家用人单位中
2025-10-20 07:43:00
2025中国机器人大赛闭幕我省9支队伍获奖河北日报讯(记者苑立立)10月19日,2025中国机器人大赛暨RoboCup机器人世界杯中国赛(中国机器人大赛赛区)在石家庄闭幕
2025-10-20 07:44:00
青春华章丨向“新”而行“模范生”,“智造”南钢获央视关注
转型实践为传统产业转型升级提供优秀范例向“新”而行“模范生”,“智造”南钢获央视关注南报网讯(记者刘安琪通讯员邵启明)“南京钢铁的转型实践为传统产业转型升级提供了优秀范例
2025-10-20 07:44:00
没有冗长的开幕致辞,减少繁琐的办会流程,10月17日至19日举行的2025中国国际数字经济博览会持续改进办会模式,更加务实高效
2025-10-20 07:44:00
聚焦2025中国国际数字经济博览会·记者观察|培育数据生态,构筑数字产业发展新优势
培育数据生态,构筑数字产业发展新优势——二〇二五中国国际数字经济博览会探新之三10月17日,观众在2025中国国际数字经济博览会参观
2025-10-20 07:47:00
聚焦2025中国国际数字经济博览会·现场丨人机协同,赛场上演“机器人总动员”
你见过“机器人总动员”吗?10月18日,记者走进石家庄(正定)国际会展中心6、7号馆,科技感扑面而来。一场场不同类别的机器人赛事激烈角逐
2025-10-19 08:23:00