• 我的订阅
  • 科技

Meta、斯坦福大学用生成式AI实现3D空间环境人机交互

类别:科技 发布时间:2023-12-12 10:04:00 来源:映维网

(映维网Nweon 2023年12月12日)斯坦福大学和Meta旗下的FAIR团队日前介绍了一种突破性的人工智能系统:仅根据文本描述就可以在虚拟人和物之间产生自然的同步运动。

这个新系统名为CHOIS(Controllable Human-Object Interaction Synthesis/可控人-物交互合成),而它采用最新的条件扩散模型技术来产生无缝和精确的交互,比如“把桌子举过头顶,走路,放下桌子”。

展望未来,以后的虚拟生物将可以像人类一样流畅地理解和响应语言命令,而系统可以从语言描述中生成连续的人机交互。

Meta、斯坦福大学用生成式AI实现3D空间环境人机交互

团队指出,在3D环境中合成人类行为对于计算机图形学、嵌入式人工智能和机器人技术等应用至关重要。尽管人类可以毫不费力地在环境中导航和执行任务,但这对机器人和虚拟人而言是十分艰巨的挑战,因为每一项任务都需要人、物和周围环境之间的精确协调。

在另一方面,语言是表达目的意图的有力工具。在语言和场景背景的指导下,合成逼真的人类和物体运动是构建先进人工智能系统的基石。

斯坦福大学和FAIR团队认为,尽管现在已有研究在探索人-场景交互问题,但它们仅限于具有静态对象的场景,忽略了日常生活中频繁发生的高度动态交互。另外,尽管业界最近在动态人-物交互建模方面取得了进展,但相关方法只关注较小的对象,或者缺乏操纵多种对象的能力。即便存在探索操纵更大尺寸的各种物体,但它们依赖于过去的交互状态序列或物体运动的完整序列,无法单独从初始状态合成物体运动和人体运动。

所以在CHOIS的研究中,团队专注于从语言和初始状态合成涉及更大尺寸的不同对象的逼真交互。

从语言描述生成连续的人机交互带来了数个挑战。首先,我们需要生成逼真和同步的物体和人体运动。在交互过程中,人的手应该与物体保持适当的接触,物体的运动应该与人的行为保持因果关系。

其次,3D场景中经常有大量的物体,限制了可行运动轨迹的空间。因此,交互合成必须适应环境的混乱,而不是在一个空场景的假设下操作。

对于CHOIS,团队重点研究了从自然语言命令合成三维环境中人-物交互的关键问题,在语言和稀疏物体路径点的指导下生成物体运动和人体运动。

运动应该与语言输入中指定的指令保持一致,同时符合由3D场景几何导出的航路点条件定义的环境约束。为了实现这一点,研究人员采用条件扩散模型来同时生成同步的物体和人体运动,条件是语言描述、初始状态和稀疏的物体路径点。

为了提高预测物体运动的准确性,在训练过程中加入了物体几何损失。另外,他们设计了在采样过程中应用的guidance term,以提高生成交互的真实感。

实验证明了学习交互合成模块在系统中的有效性,可以在给定语言描述和3D场景的情况下产生连续的逼真和情景感知交互。

通过条件扩散模型,CHOIS系统可以模拟生成详细运动序列。当给定人类和物体位置的初始状态,以及所需任务的语言描述时,CHOIS就能够生成一系列运动。

例如,如果指令是将灯移近沙发,CHOIS就会理解这个指令,并创建一个逼真的动画,令人类化身拿起灯并将其放在沙发附近。

使得CHOIS特别独特的是,它使用稀疏的对象路径点和语言描述来指导动画。路径点充当对象轨迹中关键点的标记,确保运动不仅在物理上合理,而且与语言输入概述的目标保持一致。

CHOIS的独特之处同时在于它将语言理解与物理模拟结合在一起。传统模型往往难以将语言与空间和物理动作联系起来,特别是在更长时间的交互范围内,它们必须考虑诸多因素才能保持真实性。

通过解释语言描述背后的意图和风格,然后将它们解读成一系列尊重人体和所涉及对象约束的物理运动,CHOIS可以弥合了这一差距。系统确保了接触点(如手触摸物体)可以准确地呈现出来,并且物体运动与虚拟人施加的力一致。

CHOIS系统可以对一系列的领域产生深远的影响,特别是在动画和虚拟现实领域。如果人工智能能够解释自然语言指令并生成逼真的人机交互,CHOIS可以大大减少制作复杂场景动画所需的时间和精力,而且在虚拟现实环境中,CHOIS可以带来更加身临其境的交互式体验,因为用户可以通过自然语言命令虚拟角色,并看到它们以逼真的精度执行任务。

这种高水平的交互可以将VR体验从僵硬的脚本事件转变为对用户输入做出真实响应的动态环境。

研究小组认为,他们的研究是朝着创造可以在不同3D环境中模拟连续人类行为的先进人工智能系统迈出的重要一步。它同时为进一步研究从3D场景和语言输入中合成人机交互打开了大门,并可能会在未来带来更复杂的人工智能系统。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-12-12 12:45:52

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

最新美国国家人工智能科学院院士介绍
...擎和广告系统提供了强大的技术支持。EmmaBrunskill,来自斯坦福大学。她的研究方向是强化学习和机器人技术,通过设计先进的算法
2024-03-24 08:39:00
本文转自:人民邮电报近日,斯坦福大学研究团队提出了一种名为DetectGPT的新方法,旨在成为首批打击高等教育中LLM生成文本的工具之一。相关研究论文已发表在预印本网站arXiv
2023-01-31 09:46:00
斯坦福AI视频生成工具免费开放!30秒时长,马斯克看了效果会沉默
...I,可加入官方DiscordHedra此次发布的基础模型Character-1由前斯坦福大学顶尖研究团队领导。首席执行官Michael Lingelbach
2024-06-21 11:01:00
生成模型真实物理引擎Genesis来了!由全球AI顶尖高校团队开发
来自卡内基梅隆大学、马里兰大学、哥伦比亚大学、斯坦福大学、麻省理工学院、清华、北大、港大等全球 AI 顶尖高校和 Nvdia 等研究机构的华人团队
2024-12-20 09:22:00
36氪首发 | 从消毒延伸至空气管理全场景,「清越科技」完成数千万元A轮融资
...期项目,孵化于美国硅谷,成立于2020年。创始团队来自斯坦福大学、伊利诺伊大学、伦敦政治经济学院等,在电化学、电催化、催化剂研究与应用等领域都有丰富的经验。此前,清越科技的首
2023-03-14 09:07:00
李飞飞初创公司完成2.3亿美元融资,目标打造3D世界模型
...。当地时间9月13日,据外媒报道,由著名计算机科学家、斯坦福大学人工智能实验室联合主任、斯坦福大学教授李飞飞联合创办的World Labs正式启动
2024-09-14 11:41:00
斯坦福大学推出detectgpt检测机器生成文本新方法
...为如此,现在需要有检测机器生成的文本的系统。最近,斯坦福大学的一个研究小组提出了一种名为DetectGPT的新方法,旨在成为打击高等教育中机器生成文本的首批工具之一。该方法基
2023-01-29 10:54:00
斯坦福团队研发新型深度学习模型,能预测碳捕集引起的地表位移
近日,美国斯坦福大学团队利用深度学习中的计算机视觉技术,打造出一款新型深度学习模型。从地下地层结构图像出发,他们成功预测了二氧化碳捕集与封存技术(CCS
2024-04-08 10:16:00
空间智能新进展:教机器人组装家具,实现操作步骤与真实视频对齐
...的空间推理能力仍显不足。作者简介本项目第一作者,是斯坦福大学计算机科学硕士生刘雨浓(Yunong Liu)目前在斯坦福SVL实验室(Vision and Learning Lab)
2024-11-27 09:57:00
更多关于科技的资讯:
“车BA” 南京争霸
8月23日,“车BA”小米集团汽车部跨区域篮球争霸赛决赛在南京举行,来自北京、上海、武汉等地的7支参赛队伍齐聚古都南京,角逐冠军。 南京日报/紫金山新闻记者 段仁虎 摄
2025-08-24 09:50:00
“关不掉”的免密支付,肥了平台的钱包?
原标题| “关不掉”的免密支付,肥了平台的钱包?近日,话题“一定要关闭免密支付和自动扣款”冲上社交平台热搜,关于免密支付功能相关的讨论再次进入大众视野
2025-08-24 05:43:00
美国医疗巨头瞄准聚焦超声无创治疗赛道
近日,由美国医疗巨头强生等十余家机构组成财团,以22.5亿美元(约人民币161亿元)闪电收购了一家专注于“无创”超声波组织碎化技术(Histotripsy)的美国医疗科技公司HistoSonics多数股权
2025-08-24 07:02:00
家电业均价下滑!三翼鸟上海体验中心九成用户选高端
中国家电市场正经历均价下行的趋势。奥维云网数据显示,2025年第1周到第11周,空调、冰箱、洗衣机线上渠道均价同比分别下滑3
2025-08-23 08:20:00
在意大利:海尔空调销量TOP1
今夏,欧洲人经历了严酷“烤”验。八月初,受罕见热浪侵袭,意大利、法国等多国发布高温红色预警,西班牙南部气候飙升至46℃
2025-08-23 08:21:00
2025年,中国新材料产业总产值预计突破10万亿元,但在被列为“卡脖子”的多项关键材料中,国产化率不足30%。铝,作为全球产量第一
2025-08-23 08:22:00
单店年入过亿!三翼鸟上海体验中心是如何做到的?
当前,实体零售业正面临着变革与挑战,一方面,线上浪潮带来的冲击清晰可见:传统卖场客流锐减、部分门店面临关停挑战,《2025到店零售3
2025-08-23 08:22:00
省心比省钱重要!三翼鸟上海体验中心8成用户定制场景
当前,消费者在居家领域的决策逻辑正经历深刻变革。过往,性价比常是左右消费者选购家电、家居产品的核心要素,而如今,“省心”已逐渐攀升至决策考量的优先位置
2025-08-23 08:23:00
8月23日19:00,“河北五超”承德vs保定,最硬核的主场,承德“硬核宠粉”现场抽奖送钻石!
2025-08-23 08:53:00
厦门网讯(厦门日报记者 李晓平)日前,《财富》中国科技50强榜单出炉,华为投资控股有限公司、DeepSeek(深度求索)
2025-08-23 09:00:00
厦门网讯(厦门日报记者 李晓平)昨日下午,“智汇鹭岛,AI赋能总部经济新生态”对接会在九牧创新中心举行,聚焦鞋服、卫浴等我市优势产业
2025-08-23 09:00:00
南京火车站网约车候客区升级后,“人车互找”成过往超省心!一屏锁定车在哪,网约乘车更“丝滑”□南京日报/紫金山新闻记者吴春霞 通讯员宁交宣“家人们
2025-08-23 09:52:00
落实全省数字经济发展推进大会见行动|中国科学院与贵州大数据集团共办技术交流会共探数字化发展新路径
8月21日,中国科学院与贵州大数据集团在贵阳联合举办技术交流会。来自中国科学院信息工程研究所、中国科学院软件研究所、阿里云
2025-08-23 12:00:00
《像大师那样写作》:给所有写作者的“逆袭指南”
你是否曾感到写作之路迷雾重重?是否曾因屡屡退稿而怀疑自己缺乏“天赋”?一本刚刚问世的新书,或许能彻底改变你的写作命运——《像大师那样写作
2025-08-23 12:27:00
鸿蒙5.1网络数据安全管理能力再加强,华为浏览器守护用户隐私保护防线
2025年,中国网络安全领域呈现“监管强化”与“威胁升级”的双重态势。国家相关部门陆续落地施行《网络数据安全管理条例》等
2025-08-23 13:03:00