• 我的订阅
  • 科技

DeepMind新款AI Agent会玩山羊模拟器,目前已能完成600条指令

类别:科技 发布时间:2024-03-15 10:41:00 来源:DeepTech深科技

奔跑吧,山羊!谷歌 DeepMind 的一款新的人工智能代理(AI Agent)学会了玩不同的游戏,包括它以前从未见过的游戏,比如山羊模拟器。这是一款有趣的动作游戏,具有夸张的物理效果。

研究人员能够让它按照文本指令玩七种不同的游戏,并在三种不同的 3D 研究环境中移动。

这是迈向更通用的人工智能的一步,因为它可以在多个环境中使用类似的技能。

在过去,谷歌 DeepMind 在开发游戏人工智能系统方面取得了巨大成功。它开发的 AlphaGo 在 2016 年的围棋比赛中击败了顶级棋手李世石,是展示深度学习力量的一个重要里程碑。

但不同的是,早期的人工智能系统只能精通一种游戏,或者只能遵循单个目标或命令,而这种新的人工智能代理能够玩各种不同的游戏,包括英灵神殿和无人深空。它被称为 SIMA,是“可扩展、可指导、多世界代理”的缩写。

在训练人工智能系统时,游戏很适合用来模拟现实世界的任务。美国斯坦福大学计算机科学副教授迈克尔·伯恩斯坦(Michael Bernstein)表示:“原则上,相比在一个简单的环境中训练,一个普通的游戏代理可以学习到更多关于如何探索我们的世界的知识。”他没有参与这项研究。

谷歌 DeepMind 的研究工程师提姆·哈雷(Tim Harley)是开发团队的一员,他说:“人们可以想象,有一天,我们可以让 SIMA 这样的代理与你和你的朋友一起玩游戏,而不是让你对抗强度变态的电脑 NPC(Non-Player Character,非玩家角色)。”

DeepMind新款AI Agent会玩山羊模拟器,目前已能完成600条指令

(来源:COFFEE STAIN STUDIOS)

谷歌 DeepMind 的研究工程师弗雷德里克·贝斯(Frederic Besse)说,该团队在训练 SIMA 的过程中使用了大量人类单独和协作玩电子游戏的例子,还有键盘和鼠标输入,以及玩家在游戏中所做行为的注释。

他们使用了一种名为模仿学习的人工智能技术,教智能代理像人类一样玩游戏。SIMA 可以完成 600 条基本指令,如“左转”“爬梯子”和“打开地图”,每一条指令都可以在大约 10 秒内完成。

研究小组发现,一个受过多种游戏训练的 SIMA 代理比一个只掌握了一种游戏的代理表现要好。

贝斯说,这是因为它能够利用游戏之间相似的概念来学习更好的技能,更好地执行指令。

他说:“这是一个非常令人兴奋的重要属性,因为我们得到的代理可以玩从未见过的游戏。”

英国伦敦玛丽女王大学人工智能讲师保罗·劳伯(Paulo Rauber)表示,看到这种游戏之间的知识转移是人工智能研究的一个重要里程碑。

劳伯说,以人类提供的例子为基础并学习执行指令,这一基本思想可能会在未来产生更强大的系统,尤其是有了更大的数据集之后。他认为,SIMA 相对有限的数据集影响了它的性能。

负责英伟达人工智能代理项目的高级研究科学家 Jim Fan 表示,尽管 SIMA 训练的游戏环境数量仍然很少,但它正走在正确的扩大规模的路上。

但哈雷说,人工智能系统离人类的水平还有很大差距。例如,在无人深空游戏中,人工智能代理只能完成人类能完成的 60% 的任务。当研究人员禁止人类玩家向 SIMA 发出指令后,该代理的表现比之前差了很多。

贝斯说,团队接下来将努力提高代理的表现。研究人员希望它能在尽可能多的环境中工作,并学习新技能,他们希望人们能够与代理聊天并得到回应。

该团队还希望 SIMA 拥有更通用的技能,使其能够像人类一样快速上手从未见过的游戏。

贝斯说,人类“能够很快适应没见过的环境和情况。我们希望我们的人工智能代理也一样。”

美国加州大学欧文分校助理教授罗伊·福克斯(Roy Fox)表示,SIMA 使我们离自主代理的“ChatGPT 时刻”更近了一步。

但这离真正的自主人工智能还有很长的路要走。他说,那将是“一场完全不同的游戏”。

作者简介:梅丽莎·海基莱(Melissa Heikkilä)是《麻省理工科技评论》的资深记者,她着重报道人工智能及其如何改变我们的社会。此前,她曾在 POLITICO 撰写有关人工智能政策和政治的文章。她还曾在《经济学人》工作,并曾担任新闻主播。

支持:Ren

运营/排版:何晨龙

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-03-15 11:45:10

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

全球首篇!调研近400篇文献,鹏城实验室&中大深度解析具身智能
...zhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com具身智能是实现通用人工智能的必经之路
2024-07-29 09:39:00
...月10日,为了解南昌驾驶培训行业运用VR虚拟现实技术与AI人工智能科技培训驾驶学员的状况,记者探访几家驾校后,发现在科技手段的加持下,传统的学车模式已经被颠覆,驾驶培训的过程
2024-04-16 08:27:00
“世界模拟器”的文化偏见与AIGC时代的文化竞争
...型Sora演示素材发布后,再次在全球范围引发了对生成式人工智能的迭代进化及内容生成能力的关注。它可以根据简单的文本指令生成长达60秒的高质量视频。这些视频不仅背景细致,还包含
2024-04-10 10:41:00
5项重大更新,NVIDIA助力人形机器人研发迈入新阶段
近日,AI(人工智能)芯片龙头 NVIDIA 创始人兼首席执行官黄仁勋在 CadenceLIVE 2024 大会表示,人类将构建“人形机器人”时代
2024-05-16 15:10:00
Sora冲击波 抢人“饭碗”促生新职业?
...出现”。1Sora有多厉害Sora理解、模拟真实世界 加速通用人工智能的实现近日,OpenAI正式发布了旗下首款视频生成模型Sora
2024-03-02 09:59:00
...文本指令自动生成真实度极高的视频内容,意味着生成式人工智能技术再次取得重大突破。这种技术一旦用于作战指挥领域,或将出现颠覆性变革。指挥语言由图文抽象向视频具象转变。Sora的
2024-04-09 05:19:00
Nature最新封面:AI战胜了人类世界冠军,创下最快无人机竞速记录
人工智能(AI)再次战胜了人类冠军。这一次,是在无人机竞速领域。来自苏黎世大学机器人与感知研究组(Robotics and Perception Group)的 Elia Kau
2023-08-31 10:12:00
我国首个!通用人工智能大型社会模拟器发布
快科技3月30日消息,据报道,2025中关村论坛年会通用人工智能论坛现场,一项重大科技创新成果正式亮相——由北京大学武汉人工智能研究院与北京通用人工智能研究院联合研发的我国首个通
2025-03-30 23:08:00
湖北籍归国科学家朱松纯 在汉建设首个大型社会模拟器
全球著名计算机视觉专家、统计与应用数学家、人工智能专家朱松纯 记者周三春 摄20年前,尚在美国的他就推动在湖北鄂州成立全球首个计算机视觉领域研究院;4年前,他携前沿人工智能技术回
2024-07-27 13:35:00
更多关于科技的资讯:
■王哲娟摘要:在数字化与知识经济时代,企业的竞争边界不断扩展,组织间的关系由单向依附转向多层协同。协同创新成为企业嵌入生态系统
2026-01-05 05:42:00
东南网龙岩1月4日讯(通讯员 詹春艳 林培民)近日,龙岩市新罗区10千伏中新线上空,一场静默而精准的“人机协同”带电作业悄然完成
2026-01-04 23:27:00
蔡高民:颠覆认知!打破西方理论垄断!中国老年学自主知识体系诞生
《全生命周期养能力发展与医养结合:理论和实践》的核心突破,在于建构“养”的元概念、定义与内涵外延,并以此为基础构建了逻辑自洽的三大理论体系
2026-01-04 20:15:00
编者按:周期更迭,变量叠加。站在“十五五”开局之年的关键节点上,各行业如何调整节奏、校准路径、寻找增量?中新经纬广邀多领域学者
2026-01-04 20:21:00
春节临近,年味渐浓。在贵阳,一场不同于传统年货市集的新春活动正在酝酿——它以“创意游乐场”为定位,融合在地风物、潮流文化与青年创造力
2026-01-04 21:50:00
不经意晃动手机,软件立即跳转购物页面。最近,记者实测发现,备受诟病的“摇一摇跳转”广告乱象依然时有发生,困扰着不少用户
2026-01-04 17:59:00
2025年度帆书APP经典热搜榜,精准解锁经典中的成长指南
当“信息过载”成为常态,“选择困难”深入骨髓,我们比任何时候都更需要一个清晰的信号:什么才是值得投入时间的真知?近日,帆书APP根据全年用户收听数据发布的“经典热搜榜”
2026-01-04 14:25:00
黄鹤权据光明网报道,英国《剑桥词典》将2025年年度词汇定为“准社交”,形容个体单方面与名人、虚拟角色或聊天机器人产生的密切连接感
2026-01-04 14:25:00
飞晟科技入选海南省儋州市中小企业数字化转型城市试点服务商
近日,海南省儋州市科学技术和工业信息化局对外公示《儋州市中小企业数字化转型城市试点服务商拟纳入名单(第一批)》。公示名单显示
2026-01-04 15:28:00
抖音生活服务联合南京德基广场落地“心动街区”,电视台直播+明星见面会+打卡活动助力商圈消费
12月30日,抖音生活服务“心动街区”活动联合江苏电视台城市频道零距离栏目发起“心动德基24h·南京跨年在德基”美食专场直播
2026-01-04 15:30:00
浪潮卓数大数据旗下公司入围多项2025年山东省大数据产业“三优两重”项目
近日,山东省工业和信息化厅正式公布2025年山东省大数据产业“三优两重”项目名单。浪潮卓数大数据旗下天元征信公司、浪潮(山东)大数据科技有限公司
2026-01-04 15:31:00
华麟数科推出联盟生态链“麒麟链”,加速数字经济深度融合与转型
【中国,2026年1月】 —— 在数字经济浪潮席卷全球、深入渗透各行各业的关键阶段,华麟数科(广东)有限公司(以下简称“华麟数科”)正式宣布
2026-01-04 15:31:00
以具身智能赋能教育未来----开普勒机器人助力高校产学研融合创新
在新一轮科技革命与产业变革加速演进的背景下,人工智能正从"算法与算力"的竞争,走向"智能体与真实世界深度融合"的新阶段
2026-01-04 15:33:00
中国首个!新奈发布“智能呼吸工程体系”,破解家用呼吸设备长期安全难题
在睡眠与呼吸健康领域,真正的改变往往不是某一功能的增加,而是背后那套长期支撑它持续进化的技术体系。2025年12月,新奈 Synaire 对外发布年度科研成果
2026-01-04 15:33:00
中国科技定义未来运动 HURA超现实远程赛车亮相世界未来运动会
2025年12月18日至23日,全球体育科技前沿的目光齐聚阿联酋首都阿布扎比国家展览中心。在这里举办的2025世界未来运动会(Games of the Future 2025)上
2026-01-04 15:33:00