• 我的订阅
  • 科技

上交大推出“可进化游戏引擎”!虚拟世界演化无需预设

类别:科技 发布时间:2024-09-05 10:04:00 来源:量子位

试问谁小时候没有幻想过有一只专属于自己的宝可梦?(可以DIY的那种~)

最近上海交通大学、哈工大深圳校区联合团队整了个“可进化游戏引擎”,实现了这个儿时梦想:

大模型与传统游戏引擎结合,能够被被特定的条件触发,自动地成长出新的代码。

选择宝可梦题材做实验,是因为团队中大部分成员都是宝可梦粉丝,目前相关论文已上传ArXiv平台。

上交大推出“可进化游戏引擎”!虚拟世界演化无需预设

「失控玩家」走进现实

研究团队用电影《失控玩家》中的主人公 “Guy”举了一个的例子。

Guy原本是虚拟游戏中的一名NPC,每天都生活在被规划好的剧本里,每天重复着相同的事情。但在阴差阳错下,他却拥有了改变生活、打破剧本的能力。

研究人员们非常希望在其他游戏中也能看到类似的情节 ———NPC在线进化。

例如被蜘蛛咬到、发现奇妙的宝藏等,从而解锁全新的能力,甚至有可能在某一天转变为反派角色。

不过他们幻想的内容大多数并不在虚拟世界的剧本中,无法被实现。

因此,他们将虚拟世界的进化特性联系到了其背后引擎的可拓展性:当前虚拟世界的引擎不具备可拓展性,无法拓展出新的内容,从而无法发生进化。

于是他们提出了一种全新的引擎Delta-Engine,它能够被特定的条件触发,从而自动地成长出新的代码。

Delta-Engine由两个组件构成:

基座引擎(Base Engine):一个原始的引擎,它刻画了虚拟世界最初的样子,代表了其静态的部分。

代理模型(Neural Proxy):一个神经网络作为基座引擎的外包装,它代表了虚拟世界可变的部分,特定的输入能够触发它在基座引擎的基础上生成新的代码。

研究人员选择了一个大语言模型作为基础,他们认为大语言模型还能够支持多种类型的输入,例如文本、图像、以及脚本语言,有利于虚拟世界的打造。

而针对Delta-Engine的可拓展性,他们也相应提出了一种高效的拓展方式,叫做增量预测。

简单来说,就是让代理模型预测基座引擎上的新增内容。

他们还强调,仅对于代理模型来说,增量预测和上下文学习、RAG是相交的概念。但增量预测是对于整个Delta-Engine而言的概念,它和基座引擎的设计密切相关。

上交大推出“可进化游戏引擎”!虚拟世界演化无需预设

DIY专属宝可梦

基于Delta-Engine,研究人员们打造了一款类虚拟世界的概念游戏。

因为团队大部分人都是宝可梦游戏的粉丝,因此他们决定把主角定为一只可进化的宝可梦,打造一款名为Delta-Pokémon的游戏。

在传统的宝可梦游戏中,各个角色的内容包括其成长模式都是被预设好的。

而在Delta-Pokémon中,玩家将为自己量身定做一只专属宝可梦,从最初阶段的白板宝可梦,通过不断的对战,从而进化学会全新的能力。

每一次进化将完全取决于玩家的意愿,玩家可以通过自然语言,根据自己的喜好任意地编写新的属性、特性、以及技能。

上交大推出“可进化游戏引擎”!虚拟世界演化无需预设

研究人员称其为开放角色扮演游戏(ORPG),每一名玩家的游戏中角色都会各不相同。

他们认为,玩家在虚拟世界中的形象是他在真实世界中的映射,能够反映玩家的某种欲望,可能是对现实世界的抽离、或是对现实世界的深入。

ORPG带来的开放性,能够极大程度满足玩家对自我的另一种表达。

Delta-Pokémon中每一个创建的角色都对应着一个Delta-Engine。

玩家首先输入自然语言,随后会被转换成对应的角色剧本。Delta-Engine接受角色剧本生成相应的角色代码。随着角色的进化,引擎也会随之膨胀。

研究人员还提供了他们设计的一只宝可梦作为示例,它以以下剧本初始化:

上交大推出“可进化游戏引擎”!虚拟世界演化无需预设

Delta-Engine的输出为:

上交大推出“可进化游戏引擎”!虚拟世界演化无需预设

仔细看,其实能够很轻松找到代码和上方剧本的对应关系。

onswitch对应了宝可梦的胜利之心特性,而move_1和move_2分别对应了两个招式,波导弹和加农光炮。

值得注意的是,胜利之心是研究人员原创的特性,不属于官方特性,这也是ORPG的特点之一,玩家可以自行创造自己的专属内容。

接下来关键的内容来了,研究人员再次输入:

上交大推出“可进化游戏引擎”!虚拟世界演化无需预设

Delta-Engine的输出为:

上交大推出“可进化游戏引擎”!虚拟世界演化无需预设

以上为Delta-Engine增量预测的结果,它在初始代码的基础上新增了三个类方法,来实现新的保护招式。

理论上来说,基于特定的输入,Delta-Engine可以无限制地进行这种新增,从而让角色开放式地进化。

上交大推出“可进化游戏引擎”!虚拟世界演化无需预设

Delta-Pokémon 是怎么做出来的?

由于Delta-Engine引入了代理模型,它的开发过程离不开对代理模型的对齐。

这个过程需要一定量、或是大量的训练数据。

而Delta-Engine所需的数据主要有两个方面:

新颖(Novelty):和其他场景类似,Delta-Engine需要新颖且多样的数据,一味重复的数据会造成性能瓶颈。

有趣(Interestingness):数据的内容上还需要做到有趣,来提升玩家的体验。然而有趣性的评估相当困难,因此他们采用了一种启发式的评估准则。

但研究人员认为大语言模型并不具有想象力,它表现出的想象力很大程度来源于指令中提供的线索。因此,仅仅靠提示大语言模型让其发挥想象力并不能获得新颖的结果。

为此他们给出了一种解决思路,即在提示中引入一段对实体的描述性文字,称之为原型。原型去显示地提示大语言模型该怎么进行联想。

例如,将霸王龙作为原型让Claude3设计一只宝可梦,Claude3于是给出了一只具备“顶级捕食者”和“泰坦之咬”特性的全新宝可梦。

有意思的是,原型不仅仅能够采自于现实世界,还能是一系列虚拟生物,例如一部分训练数据的原型取自于游戏《怪物猎人》中的冰狼龙。

上交大推出“可进化游戏引擎”!虚拟世界演化无需预设

除此之外,研究人员还采用了一种启发式的方法来量化一个样本的有趣性。

他们认为有趣性可以被量化为一系列潜在的可能让玩家感觉到有趣的“有趣因子”,有趣因子越多,玩家越有可能觉得有趣。

他们将这些有趣因子称为有趣性标签(Tag of Interest),需要一个标注模块来为一条样本标注出这些标签。一个样本的所有这些标签可以用一个布尔向量来表示,按照他们对有趣性的假设,向量的模越大,则有趣性越高。

研究人员因此针对宝可梦设计了一个标签集,其中包含近50种有趣性标签,例如吸血、恢复、强化等。在设计宝可梦时,其有趣性低于某一阈值的样本将被过滤。

为了满足上述两种需求,他们还采用了一种人类和大语言模型协同设计(Co-Design)的管线。

因为他们觉得虽然现在大语言模型可以全自动合成相关数据,但在构造数据的新颖程度、有趣性、以及正确性上AI始终是无法取代人类设计师的工作,而且合成数据中隐藏的巨大偏见也是一大隐患。

最后,研究人员给出了三种评估准则,用来全面地评估Delta-Engine的性能。

常规评估(Naive Evaluation):评估引擎的正确性,包含两个指标。

正确率(Acc):即生成的代码是否正确地实现了应有的功能。

执行率(Exe):即生成的代码是否能通过编译,不论正确与否。Exe对于用户的体验感非常重要,很多情况下,相比功能不匹配,无法正确运行会带来更强烈的负面感受。

为此他们还专门构造了“简单”和“困难”两部分的测试集。

简单部分包含了43条样本,皆来自于官方存在的宝可梦。困难部分皆为由专家撰写的原创宝可梦,数据分布和现有的宝可梦存在较大差异,总共包含了70条样本。

研究人员使用了近500条高质量训练样本来微调CodeGemma-7b,从而观察不同训练数据量下,引擎性能的变化。

上交大推出“可进化游戏引擎”!虚拟世界演化无需预设

增量评估:评估Delta-Engine的性能与其内容量之间的关系。

随着引擎内容的不断膨胀,其上下文会越来越长,其性能也会遇到挑战。

研究人员通过随机缝合100只“宝可梦”,获得了一张引擎性能图。

蓝色竖线代表的是用于训练的最大输入长度。可以看到一只宝可梦进行20次进化后,上下文长度达到了5k,40次进化将达到10k。但大约在10次进化过后,引擎的增量预测性能开始了阶梯式下滑。

对此研究人员指出,代理模型的长度延展性对于Delta-Engine来说非常重要。

上交大推出“可进化游戏引擎”!虚拟世界演化无需预设

对抗评估:应对用户给出的非常规输入。

由于Delta-Engine带来的高度开放性,用户的大部分输入都会被允许,此时不乏有用户处于好奇和娱乐的心态,尝试输入一些稀奇古怪的内容来试探引擎。

研究人员对此表示高度理解,并将所有这类输入统称为对抗输入。在对抗评估中,引擎的执行率尤为重要,因为大部分对抗输入不存在正确解。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-09-05 11:45:08

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

8项!上海交大与齐鲁工大(省科学院)签订对口合作备忘录
...远一行到齐鲁工业大学(山东省科学院)调研指导。上海交大地方合作办公室、研究生院、教务处、科学技术发展研究院、人力资源处、规划发展处、船舶海洋与建筑工程学院、机械与动力工程学院
2024-03-28 15:46:00
“零距离”:从德鲁克到张瑞敏
...司已经难以生存了,有的已经开始倒闭。所以,企业要么进化为生态,要么就是名存实亡。我们刚才说了“零距离”的三个特性。那零距离到底意味着什么?就意味着我们的组织内是零距离的,也就
2024-09-24 09:59:00
屹立潮头40年,看海尔的超级“进化论”
12月26日,海尔迎来了创业40周年纪念日,以“进化有缘起 生态无边界”为主题的海尔集团创业40周年纪念会暨未来十年发展战略研讨会在青岛举行。创业40年来,海尔坚定传承创业创新的
2024-12-27 20:31:00
600光年外的“超级地球”:平均温度22度,人类移民能实现吗?
...地球的氧气含量大幅度增加,这两次事件对于地球生命的进化来说起到了非常关键的作用,很多新的生命形式开始出现,比如说多细胞生物、无脊椎动物等等,到了寒武纪时期,地球上出现了生命大
2024-05-29 09:37:00
AI助飞,这些科学家创业“多快好省”|科研范式变革催生新质生产力调查·下
...’这样的事了。”这些日子,洪亮刚刚完成“搬家”,其交大闵行校区等处的研发资源,正“聚焦”到张江高研院。上海交大张江高研院群楼。作为交叉研究高地的这个新型研究机构,已搭建起七大
2024-10-11 09:52:00
...第一的童车,一直是优贝的“EZ”系列。从造车到玩车的进化有门店、有场地、有赛事……有了造车做基础,静海也成为自行车爱好者骑行的乐土。在静海,东方红路上聚集着十几家自行车、电动
2024-02-15 01:04:00
...科幻作家交流的机会和渠道,让更多有价值的创新以产业进化的方式、社会进步的方式开花结果。
2024-05-20 00:18:00
【科学的温度】人工智能时代,科学家会失业吗?
...,但在其他方面却又表现得非常粗糙。他认为,如同人的进化一样,AI算法也需要长期的演变和进化,才能做到在细微之处和人类情感相近。就目前来看,AI是不可能做到的。那AI的发展是否
2022-12-23 18:28:00
人工智能:时代的机遇和挑战 引擎已启动 出航正当时!
...人工智能,正在深刻改变人类的生活方式。而一日千里的进化,离不开加速迭代的技术支撑,它们为人工智能的飞速发展筑牢了基石。如果将海量的数据视作起步的燃料;那么加速进化的大模型算法
2024-02-26 14:33:00
更多关于科技的资讯: