• 我的订阅
  • 科技

谷歌让 12 个 AI 大模型攒局玩“大富翁”:Claude3.5 爱合作,GPT-4o 最“自私”

类别:科技 发布时间:2024-12-20 09:28:00 来源:IT之家

给大模型智能体组一桌“大富翁”,他们会选择合作还是相互拆台?实验表明,不同的模型在这件事上喜好也不一样,比如基于 Claude 3.5 Sonnet 的智能体,就会表现出极强的合作意识。

而 GPT-4o 则是主打一个“自私”,只考虑自己的短期利益。

这个结果来自 Google DeepMind 和一位独立研究者的最新合作。参加游戏的智能体背后的模型分别是 GPT-4o、Claude 3.5 Sonnet 和 Gemini 1.5 Flash。

每个模型各产生 12 个智能体,这 12 个智能体坐在一桌上进行博弈。游戏看上去大富翁有一点相似,但相对简单,玩家只需要对手中的“资源”做出处置。这当中,虽然每个玩家心里都有各自的小九九,但作者关注的目标,是让总体资源变得更多。

12 个智能体组一桌游戏

作者组织的“大富翁”游戏,真名叫做 Donor Game(捐赠博弈)。

在这过程中,作者关注的是各模型组成的智能体群体的表现,因此不同模型产生的智能体不会出现在同一局游戏当中。

再说简单些,就是 GPT 和 GPT 坐一桌,Claude 和 Claude 坐一桌。

每个桌上坐了 12 个智能体,它们各自手中都握有一定量的“资源”,系统会从这 12 名玩家中随机抽取 2 个,分别作为“捐赠者”和“受赠者”。

捐赠者可以选择将自己手中的部分资源捐赠给受赠者,受赠者获得的资源是捐赠者捐赠资源的两倍。

也就是说,捐赠者每花费掉一份资源时,受赠者都可以获得两份,这也是总体资源能够增加的来源。

不过对于单个个体而言,选择不进行捐献,在短期内的收益会更高。

在做决定之时,捐赠者能够知道受赠者之前做出的决定,从而判断是否要捐赠。

这样的“捐赠”,每一代中一共会进行 12 次,一轮结束后,手中资源量排在前 6 名的智能体可以保留至下一代。

同时,下一代会产生 6 个新的智能体,这 6 个新智能体会从留下的 6 个智能体那里学习策略,但同时为了差异化也会引入随机变异。

包括初始的一代在内,基于每个模型产生的智能体,都会进行十轮迭代。

谷歌让 12 个 AI 大模型攒局玩“大富翁”:Claude3.5 爱合作,GPT-4o 最“自私”

上述过程就是一次完整实验,针对每个模型,作者都会实验五次,然后比较总资源量的平均值,以及最终策略的复杂程度。

Claude 喜欢合作,GPT 最自私

一通测试下来,作者发现基于 Claude 的智能体种群的平均资源量每一代都稳步增长,总体合作水平越来越高。

相比之下,基于 GPT 的智能体种群合作水平总体呈现下降趋势,看上去非常“自私”。

基于 Gemini 的种群表现则介于二者之间,它们的合作水平有所提高,但和 Claude 比差距还是很大,并且表现不太稳定。

谷歌让 12 个 AI 大模型攒局玩“大富翁”:Claude3.5 爱合作,GPT-4o 最“自私”

而从策略角度来看,经历了 10 代的积累之后,三个模型产生的经验都变得相当复杂,但以 Claude 最为突出。

谷歌让 12 个 AI 大模型攒局玩“大富翁”:Claude3.5 爱合作,GPT-4o 最“自私”

进一步地,作者还引入了“惩罚机制”,即捐赠者可以花费一定资源,让“受赠者”手中的资源减少相应的两倍。

结果,该机制对 Claude 模型的影响最为积极 ——Claude 种群最终的平均资源量是无惩罚情况下的 2 倍左右,并且所有 5 次实验都表现出了增长趋势。

对 GPT 模型的影响则非常有限,PT 种群的平均资源量也始终徘徊在较低水平,甚至随轮次增加有下降,表明惩罚机制并没有改变 GPT 的“自私”想法。

对 Gemini 模型的影响最为复杂,在个别情况下 Gemini 种群借助惩罚机制将平均资源量提高到了 600 以上,明显高于无惩罚的情况;

但更多情况下,Gemini 种群在引入惩罚后出现了更严重的“合作崩溃”,平均资源量急剧下跌,表明 Gemini 智能体容易因过度惩罚而陷入报复的恶性循环。

谷歌让 12 个 AI 大模型攒局玩“大富翁”:Claude3.5 爱合作,GPT-4o 最“自私”

有网友认为,这个实验可以启发新的研究方向,比如用智能体来进行大规模的社会学实验,可能会带来一些有趣的新可能性。

脑洞更大的网友,想到了可以借用智能体实现科幻小说中描绘的场景,运行数以百万计的模拟约会或战争游戏。

不过,也有人认为实验中观测到的合作现象,可能只是对训练数据中人类对话的模仿,并不能说明智能体当中可以产生“文化进化”。

谷歌让 12 个 AI 大模型攒局玩“大富翁”:Claude3.5 爱合作,GPT-4o 最“自私”

论文地址:https://arxiv.org/abs/2412.10270

参考链接:https://news.ycombinator.com/item?id=42450950

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-12-20 12:45:02

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

百度透露大模型与搜索引擎结合进展:支持视频和图表回答提问
...的成败,相关决定预计最早在下周作出。(界面)游戏《大富翁11》上线WeGame及蒸汽平台6月30日,由中手游旗下全资子公司软星科技研发的强手棋类休闲游戏《大富翁11》上线WeGame及蒸汽平台
2023-06-30 22:42:00
近日,据外媒报道,经典桌游《大富翁地产大亨》将拍摄真人电影,该片将由《芭比》制作公司LuckyChap、孩之宝合作推出,玛格特·罗比将担任制片人。值得一提的是,LuckyChap
2024-04-12 21:34:00
《超级马力欧》给信心!《大富翁》有望推大电影
...计年底完成交易。而接下来,狮门影业将打造经典游戏《大富翁》的大电影,特别是今年和真人电影的票房大爆,给了狮门影业信心。孩之宝首席执行官克里斯·考克在一份声明中说:“这次出售完
2023-08-04 16:01:00
《大富翁》拍真人电影;《攻壳机动队》、坂本龙一纪录片确认引进
...频号,欢迎关注【豆瓣电影】并准时收看:)知名游戏《大富翁》宣布拍真人电影知名游戏《大富翁》宣布拍真人电影,骰子掷起来。狮门、玛格特·罗比的制片公司LuckyChap、孩之宝联
2024-04-11 22:58:00
《大富翁11》上线Wegame及蒸汽平台 限时7折优惠
由中手游发行的《大富翁》系列游戏最新作《大富翁11》现已上线Wegame及蒸汽平台,30余载经典益智强手棋游戏,风靡全球华人群体,贯穿几代人的游戏记忆。快和好友一起成为大富翁吧。
2023-06-29 13:02:00
...,即可利用网络远程畅玩,IT之家获悉,具体游戏包含《大富翁GO》、《糖果传奇》和《王者荣耀》国际服等 23 款。三星表示,旗下云游戏服务没有“内容付费墙”,即用户无需按月订阅
2024-11-24 21:59:00
财经素养教育并不是培养大富翁
...商课火遍校内外,专家提醒——财经素养教育并不是培养大富翁上海财经大学附属国安路小学开展财商专题课。 (上海财经大学供图) ■本报记者 吴金娇“十节课教会孩子生钱
2023-04-21 05:55:00
大宇资讯《大富翁4 Fun》将登陆NS 7月6日上线
今日,大宇资讯宣布经营模拟游戏《大富翁4Fun》将于7月6日登陆Switch平台。游戏以《大富翁4》为基础,保留了多位人气角色与地产、股市投资等元素,还有内建多款小游戏。视频预告
2023-06-08 22:49:00
《旺卡》北美票房破亿圣诞档后来居上
...世,爸爸变成了雪人回到孩子身边的故事。03.狮门获得《大富翁》电影拍摄权 据外媒报道,狮门影业拿到了游戏《大富翁》(Monopoly)电影改编权,这是一种由美国经济学人莉兹
2023-12-29 11:41:00
更多关于科技的资讯:
记者走基层|智能安全帽,让矿工有了AI“卫士”
11月5日,中煤张家口煤矿机械有限责任公司所属恒洋电器有限公司工作人员介绍智能安全帽产品。河北日报记者 魏 雨摄“嘀嘀
2025-11-13 08:03:00
“长与短”周期变革,“快与慢”时效重构,“热与冷”业态碰撞—— “双11”三重奏,解读消费新变局□南京日报/紫金山新闻记者黄琳燕11月12日中午
2025-11-13 08:05:00
南报网讯(记者周容璇)日前,在南京医药中央物流中心,一辆白色无人车平稳地穿梭于主仓库与宝湾库区之间,仅用15分钟便完成了一次驳货作业
2025-11-13 08:05:00
向“质”攀升,南京机器人解锁“智造”新图景
全链条持续发力,以硬核技术竞逐市场向“质”攀升,南京机器人解锁“智造”新图景□南京日报/紫金山新闻记者徐宁 实习生黄倩机器人是智能制造的核心组成部分
2025-11-13 08:05:00
江苏南京:“爆单堵件”难寻踪迹,科技赋能让“双11”物流运输“从从容容”
“爆单堵件”难寻踪迹,科技赋能让“双11”物流运输“从从容容” 直播间“秒光” 无人机“闪送”□南京日报/紫金山新闻记者周容璇“3
2025-11-13 08:06:00
逐浪氢能“新蓝海”,南京加速能级跃升
实现全产业链布局,链上企业持续“加码” 逐浪氢能“新蓝海”,南京加速能级跃升□南京日报/紫金山新闻记者徐宁通讯员陈伟伟郑瑞陶炎李雪莹蹲点主题
2025-11-13 08:06:00
2025 脉脉职场新人报告:超50%职场新人想跳槽,校招生最想去字节跳动
脉脉人才智库近日发布《以能为本——互联网职场新人流动趋势 2025》报告,将校招和工作经验在3年内的社招人才界定为“职场新人”
2025-11-13 08:57:00
江苏南京:多点突破屡刷纪录 科创助推产业升级
黄维院士引领南工大柔性电子全国重点实验室闯出新天地 多点突破屡刷纪录 科创助推产业升级□南京日报/紫金山新闻记者谈洁姜静实习生钱逸霖在柔性电子领域
2025-11-13 09:43:00
海尔三筒洗衣机:中国第一,海外陆续上市
11月7日,一场聚焦中国三筒洗衣机的发布活动在越南胡志明市西贡河畔举行。活动以户外用户交互嘉年华形式打造沉浸式体验,2000余名消费者
2025-11-13 10:34:00
“双11”厦门网络零售额全省第一总额397.2亿元 760家企业、1062家店铺销售额超100万元东南网11月13日讯 (海峡导报记者 孙春燕)又一年“双11”即将落幕
2025-11-13 10:48:00
辛选双十一数据出炉!销量超3000万单,总人气突破5亿
鲁网11月13日讯历时超一个月的“双 11”大促正式落下帷幕。作为快手头部直播电商企业,辛选集团在新任董事长初瑞雪的带领下
2025-11-13 11:10:00
打破学科壁垒,贯通产学研链条:宁诺以“”无边界理念回应智能时代命题
10月31日至11月2日,机器智能与自然启发计算国际会议(MIND 2025)在厦门成功举办。本次会议由多所国内外知名高校及科研机构联合主办
2025-11-13 12:05:00
长春万达滑雪场启动造雪 12.25解锁四季滑雪自由
不用等寒冬、不用等降雪,长春净月高新区万达茂里藏着一座“四季不打烊的滑雪天堂”!吉林省首家室内滑雪场长春万达滑雪场已正式启动造雪模式
2025-11-13 14:05:00
利和味道“双塔”齐聚FHC,重塑中国西式食品市场格局
2025年11月12日,第28届FHC上海环球食品展—— 一场关乎中国西式食品未来的布局正悄然展开。国内食品行业的重要参与者利和味道
2025-11-13 14:09:00
欢喜传媒引入新投资人及战略合作伙伴 共筑“AI+影视”新生态
近日,欢喜传媒集团有限公司(以下简称“欢喜传媒”)宣布引入新投资人C River Co, 发行约7.3亿股(19.9%)的新股及约7
2025-11-13 14:09:00