• 我的订阅
  • 科技

Meta、斯坦福大学用生成式AI实现3D空间环境人机交互

类别:科技 发布时间:2023-12-12 10:04:00 来源:映维网

(映维网Nweon 2023年12月12日)斯坦福大学和Meta旗下的FAIR团队日前介绍了一种突破性的人工智能系统:仅根据文本描述就可以在虚拟人和物之间产生自然的同步运动。

这个新系统名为CHOIS(Controllable Human-Object Interaction Synthesis/可控人-物交互合成),而它采用最新的条件扩散模型技术来产生无缝和精确的交互,比如“把桌子举过头顶,走路,放下桌子”。

展望未来,以后的虚拟生物将可以像人类一样流畅地理解和响应语言命令,而系统可以从语言描述中生成连续的人机交互。

Meta、斯坦福大学用生成式AI实现3D空间环境人机交互

团队指出,在3D环境中合成人类行为对于计算机图形学、嵌入式人工智能和机器人技术等应用至关重要。尽管人类可以毫不费力地在环境中导航和执行任务,但这对机器人和虚拟人而言是十分艰巨的挑战,因为每一项任务都需要人、物和周围环境之间的精确协调。

在另一方面,语言是表达目的意图的有力工具。在语言和场景背景的指导下,合成逼真的人类和物体运动是构建先进人工智能系统的基石。

斯坦福大学和FAIR团队认为,尽管现在已有研究在探索人-场景交互问题,但它们仅限于具有静态对象的场景,忽略了日常生活中频繁发生的高度动态交互。另外,尽管业界最近在动态人-物交互建模方面取得了进展,但相关方法只关注较小的对象,或者缺乏操纵多种对象的能力。即便存在探索操纵更大尺寸的各种物体,但它们依赖于过去的交互状态序列或物体运动的完整序列,无法单独从初始状态合成物体运动和人体运动。

所以在CHOIS的研究中,团队专注于从语言和初始状态合成涉及更大尺寸的不同对象的逼真交互。

从语言描述生成连续的人机交互带来了数个挑战。首先,我们需要生成逼真和同步的物体和人体运动。在交互过程中,人的手应该与物体保持适当的接触,物体的运动应该与人的行为保持因果关系。

其次,3D场景中经常有大量的物体,限制了可行运动轨迹的空间。因此,交互合成必须适应环境的混乱,而不是在一个空场景的假设下操作。

对于CHOIS,团队重点研究了从自然语言命令合成三维环境中人-物交互的关键问题,在语言和稀疏物体路径点的指导下生成物体运动和人体运动。

运动应该与语言输入中指定的指令保持一致,同时符合由3D场景几何导出的航路点条件定义的环境约束。为了实现这一点,研究人员采用条件扩散模型来同时生成同步的物体和人体运动,条件是语言描述、初始状态和稀疏的物体路径点。

为了提高预测物体运动的准确性,在训练过程中加入了物体几何损失。另外,他们设计了在采样过程中应用的guidance term,以提高生成交互的真实感。

实验证明了学习交互合成模块在系统中的有效性,可以在给定语言描述和3D场景的情况下产生连续的逼真和情景感知交互。

通过条件扩散模型,CHOIS系统可以模拟生成详细运动序列。当给定人类和物体位置的初始状态,以及所需任务的语言描述时,CHOIS就能够生成一系列运动。

例如,如果指令是将灯移近沙发,CHOIS就会理解这个指令,并创建一个逼真的动画,令人类化身拿起灯并将其放在沙发附近。

使得CHOIS特别独特的是,它使用稀疏的对象路径点和语言描述来指导动画。路径点充当对象轨迹中关键点的标记,确保运动不仅在物理上合理,而且与语言输入概述的目标保持一致。

CHOIS的独特之处同时在于它将语言理解与物理模拟结合在一起。传统模型往往难以将语言与空间和物理动作联系起来,特别是在更长时间的交互范围内,它们必须考虑诸多因素才能保持真实性。

通过解释语言描述背后的意图和风格,然后将它们解读成一系列尊重人体和所涉及对象约束的物理运动,CHOIS可以弥合了这一差距。系统确保了接触点(如手触摸物体)可以准确地呈现出来,并且物体运动与虚拟人施加的力一致。

CHOIS系统可以对一系列的领域产生深远的影响,特别是在动画和虚拟现实领域。如果人工智能能够解释自然语言指令并生成逼真的人机交互,CHOIS可以大大减少制作复杂场景动画所需的时间和精力,而且在虚拟现实环境中,CHOIS可以带来更加身临其境的交互式体验,因为用户可以通过自然语言命令虚拟角色,并看到它们以逼真的精度执行任务。

这种高水平的交互可以将VR体验从僵硬的脚本事件转变为对用户输入做出真实响应的动态环境。

研究小组认为,他们的研究是朝着创造可以在不同3D环境中模拟连续人类行为的先进人工智能系统迈出的重要一步。它同时为进一步研究从3D场景和语言输入中合成人机交互打开了大门,并可能会在未来带来更复杂的人工智能系统。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-12-12 12:45:52

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

最新美国国家人工智能科学院院士介绍
...擎和广告系统提供了强大的技术支持。EmmaBrunskill,来自斯坦福大学。她的研究方向是强化学习和机器人技术,通过设计先进的算法
2024-03-24 08:39:00
本文转自:人民邮电报近日,斯坦福大学研究团队提出了一种名为DetectGPT的新方法,旨在成为首批打击高等教育中LLM生成文本的工具之一。相关研究论文已发表在预印本网站arXiv
2023-01-31 09:46:00
斯坦福AI视频生成工具免费开放!30秒时长,马斯克看了效果会沉默
...I,可加入官方DiscordHedra此次发布的基础模型Character-1由前斯坦福大学顶尖研究团队领导。首席执行官Michael Lingelbach
2024-06-21 11:01:00
生成模型真实物理引擎Genesis来了!由全球AI顶尖高校团队开发
来自卡内基梅隆大学、马里兰大学、哥伦比亚大学、斯坦福大学、麻省理工学院、清华、北大、港大等全球 AI 顶尖高校和 Nvdia 等研究机构的华人团队
2024-12-20 09:22:00
36氪首发 | 从消毒延伸至空气管理全场景,「清越科技」完成数千万元A轮融资
...期项目,孵化于美国硅谷,成立于2020年。创始团队来自斯坦福大学、伊利诺伊大学、伦敦政治经济学院等,在电化学、电催化、催化剂研究与应用等领域都有丰富的经验。此前,清越科技的首
2023-03-14 09:07:00
李飞飞初创公司完成2.3亿美元融资,目标打造3D世界模型
...。当地时间9月13日,据外媒报道,由著名计算机科学家、斯坦福大学人工智能实验室联合主任、斯坦福大学教授李飞飞联合创办的World Labs正式启动
2024-09-14 11:41:00
斯坦福大学推出detectgpt检测机器生成文本新方法
...为如此,现在需要有检测机器生成的文本的系统。最近,斯坦福大学的一个研究小组提出了一种名为DetectGPT的新方法,旨在成为打击高等教育中机器生成文本的首批工具之一。该方法基
2023-01-29 10:54:00
斯坦福团队研发新型深度学习模型,能预测碳捕集引起的地表位移
近日,美国斯坦福大学团队利用深度学习中的计算机视觉技术,打造出一款新型深度学习模型。从地下地层结构图像出发,他们成功预测了二氧化碳捕集与封存技术(CCS
2024-04-08 10:16:00
空间智能新进展:教机器人组装家具,实现操作步骤与真实视频对齐
...的空间推理能力仍显不足。作者简介本项目第一作者,是斯坦福大学计算机科学硕士生刘雨浓(Yunong Liu)目前在斯坦福SVL实验室(Vision and Learning Lab)
2024-11-27 09:57:00
更多关于科技的资讯:
《2025加盟投资人群洞察报告》:“80后”仍是主力、“00后”快速崛起
中新经纬1月13日电 近日,中国特许加盟展&盟享加发布《2025加盟投资人群洞察报告》,(以下简称“报告”),中新经纬研究院受权发布
2026-01-13 20:35:00
“哭哭马”凭啥“马倒成功”
一只义乌产的马年玩偶,因嘴巴被缝反了方向,从“笑笑马”变成“哭哭马”,却意外成了全网追捧的“团宠”。从网友晒图引发讨论到疯狂玩梗
2026-01-13 17:04:00
苏州工业园区创新协同机制 激发共建研发机构新活力
为进一步推动研发机构面向产业发展需求,加强产学研对接和成果转移转化,让创新资源释放最大价值,近年来,苏州工业园区科技创新委员会持续探索完善科研机构共建协同机制
2026-01-13 17:20:00
大皖新闻讯 位于灵璧经济开发区的安徽儒特智能装备股份有限公司,依托自主研发的新能源电池固态电解质研磨设备,实现研磨精度从微米级向纳米级的关键技术突破
2026-01-13 17:27:00
中国消费者报报道(记者施本允)在浙江,走进任何一家中国电信营业厅,你都能看到一个温暖的角落——“爱心翼站”。这里不仅是歇脚喝水的便民点
2026-01-13 18:15:00
济南市数据要素流通服务平台入驻数商300余家,促成数据交易2.3亿元
鲁网1月13日讯(记者 李晓晨 实习生 刘璐)1月13日,济南市政府新闻办举行济南市“高质量完成‘十四五’规划”主题系列新闻发布会——数字济南建设专场
2026-01-13 18:18:00
粒子基光谱技术的工程路径与产业化前景
技术发展的轨迹常由两种力量塑造:其一是基于现有框架的持续性创新;其二则是源于基础原理突破的范式革命。后者往往能开启全新的技术轨道与应用疆域
2026-01-13 18:42:00
2026新年限定零食礼包推荐:旺旺大礼包以 “年度独家记忆” 定义春节礼赠
艾媒咨询《2024 年中国新春礼盒消费者行为洞察报告》显示,53.74% 消费者关注限定款文化属性,36.60% 看重内容独特性
2026-01-13 18:52:00
1月12日,从太钢获悉,太钢营销数智化升级项目IMP系统近日正式上线。此举将有效提升太钢营销运营效率与核心竞争力。据介绍
2026-01-13 19:51:00
在山西焦煤西山煤电西铭选煤厂的生产车间里,503精煤输送皮带承载着乌黑发亮的煤炭奔涌向前。皮带上方,一组看似简约的智能装置静静伫立
2026-01-13 19:51:00
近日,山西省工程机械有限公司工业互联网建设取得关键进展——顺利完成工业互联网标识解析二级节点注册和主机设备全量赋码与贴码工作
2026-01-13 19:51:00
2月1日,市场监管总局和国家网信办联合制定的《网络交易平台规则监督管理办法》和《直播电商监督管理办法》将正式施行。这两部与广大消费者切身利益息息相关的新规
2026-01-13 17:44:00
索乙“哭哭马”的逆袭不可复制,但年轻人情绪消费的潜力不可忽视。如果说,生产商火速将“次品”转化为爆款,形成强大的复制生产能力所展现的市场嗅觉与“变现”能力令人欣慰
2026-01-13 14:07:00
WOOK创始人许龙华:以“拙”胜“巧” 构建中国品牌出海的高速公路
十五年前,若不是一次印度尼西亚之行,WOOK创始人许龙华或许不会注意到当地零售市场假货漫天遍地,3C零售市场两极分化的混乱状态
2026-01-13 14:37:00
泰岳天成荣获2025年度电力创新奖一等奖
日前,2025年度中国电力企业联合会电力创新奖拟授奖成果正式公示。神州泰岳旗下泰岳天成参与的《基于人工智能的输变电设备全域状态感知与辅助决策技术及应用》荣获一等奖
2026-01-13 14:37:00