• 我的订阅
  • 科技

OpenAI 开发新工具,试图解释语言模型的行为

类别:科技 发布时间:2023-05-10 15:34:00 来源:浅语科技

语言模型是一种人工智能技术,可以根据给定的文本生成自然语言。OpenAI的GPT系列语言模型是目前最先进的代表之一,但IT之家注意到它们也有一个问题:它们的行为很难理解和预测。为了让语言模型更透明和可信,OpenAI正在开发一种新工具,可以自动识别语言模型中哪些部分对其行为负责,并用自然语言进行解释。

OpenAI 开发新工具,试图解释语言模型的行为

这个工具的原理是利用另一个语言模型(也就是OpenAI最新的GPT-4)来分析其他语言模型(比如OpenAI自己的GPT-2)的内部结构。语言模型由许多“神经元”组成,每个神经元都可以观察文本中的某种特定模式,并影响模型下一步的输出。例如,给定一个关于超级英雄的问题(比如“哪些超级英雄有最有用的超能力?”),一个“漫威超级英雄神经元”可能会提高模型提到漫威电影中特定超级英雄的概率。

OpenAI的工具就是利用这种机制来分解模型的各个部分。首先,它会将文本序列输入到被评估的模型中,并等待某个神经元频繁地“激活”。然后,它会将这些高度活跃的神经元“展示”给GPT-4,并让GPT-4生成一个解释。为了确定解释的准确性,它会提供给GPT-4一些文本序列,并让它预测或模拟神经元的行为。然后它会将模拟的神经元的行为与实际神经元的行为进行比较。

“通过这种方法,我们基本上可以为每个神经元生成一些初步的自然语言解释,并且还有一个分数来衡量这些解释与实际行为的匹配程度。”OpenAI可扩展对齐团队负责人JeffWu说,“我们使用GPT-4作为过程的一部分,来生成对神经元在寻找什么的解释,并评估这些解释与它实际做什么的匹配程度。”

研究人员能够为GPT-2中所有307,200个神经元生成解释,并将它们编译成一个数据集,与工具代码一起在GitHub上以开源形式发布。像这样的工具有朝一日可能被用来改善语言模型的性能,比如减少偏见或有害言论。但他们也承认,在真正有用之前,还有很长的路要走。该工具对大约1000个神经元的解释很有信心,这只是总数的一小部分。

有人可能会认为,这个工具实际上是GPT-4的广告,因为它需要GPT-4才能运行。但Wu说,这并不是这个工具的目的,它使用GPT-4只是“偶然”的,而且,相反它显示了GPT-4在这方面的弱点。他还说,它并不是为了商业应用而创建的,并且理论上可以适应除了GPT-4之外的其他语言模型。

“大多数解释的分数都很低,或者没有解释太多实际神经元的行为。”Wu说,“很多神经元的活动方式很难说清楚——比如它们在五六种不同的东西上激活,但没有明显的模式。有时候有明显的模式,但GPT-4却无法找到。”

更不用说更复杂、更新、更大的模型,或者可以浏览网页获取信息的模型了。但对于后者,Wu认为,浏览网页不会太改变工具的基本机制。他说,它只需要稍微调整一下,就可以弄清楚神经元为什么决定进行某些搜索引擎查询或访问特定网站。

“我们希望这将开辟一个有前途的途径,来以一种自动化的方式解决可解释性问题,让其他人可以建立在上面并做出贡献。”Wu说,“我们希望我们真的能够对这些模型的行为有好的解释。”

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-05-10 17:45:08

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

作者|沈筱编辑|石亚琼在AI大模型创业“学院派”中,清华系占据了半壁江山。智谱AI、聆心智能、面壁智能、深言科技、循环智能,每一个项目都备受瞩目。而近期,这股创新创业的热潮也正在
2023-05-22 11:16:00
红帽开发者分享新的ai工具
...tive(日志侦探)。这是一款正在开发的新工具,将利用AI模型来帮助分析RPM包构建失败的原因。IT之家注:RPM(RedHatPackageManager)是一种用于Linux系统的互联网下载包的打包及安装工具
2024-01-19 03:02:00
...释错误等任务。然而,该AI服务不附带其自己的大型语言模型,因此用户需要提供自己的AzureOpenAI服务端点和密钥才能使用TerminalChat功能
2023-11-18 20:47:00
李彦宏:大模型场景下开源是最贵的,多模态是通往AGI的必经之路
...是尽可能为大家提供所需的开发工具,这包括了1个基础模型系列和三大AI开发工具,“今天的中国,有10亿互联网用户,有强大的基础大模型,有足够多的AI应用场景,有全球最完备的产业
2024-04-16 17:57:00
iPhone可跑2B小钢炮!谷歌Gemma 2来袭,最强显微镜剖解LLM大脑
【新智元导读】谷歌DeepMind的小模型核弹来了,Gemma 2 2B直接击败了参数大几个数量级的GPT-3.5和Mixtral 8x7B
2024-08-02 09:55:00
Runway开发通用世界模型,想让AI更好地模拟世界
...Gen-1、Gen-2的开发商Runway突然宣布组建团队开发通用世界模型(General World Models
2023-12-22 19:48:00
OpenAI推出GPT商店,人人可0代码自制智能体,业界看好成为下一个苹果
...—更长的上下文长度、更强的控制、知识升级、多模态、模型微调定制和更高的速率限制。GPT-4的付费服务将“加量不加价”
2023-11-07 15:48:00
李彦宏:开源模型将会越来越落后 | 最前线
...来源:百度本次发布会的重磅发布,简单而言就是:基础模型全面更新,推出4.0工具版,百度还带来了三大AI开发工具,对应不同的开发场景。“它们组成了一个工具箱,支持开发者打包带走
2024-04-17 11:51:00
国泰君安证券:具身智能,人工智能的下一个浪潮
...Disembodiment),指的是认知与身体解耦(ChatGPT为代表的大模型就仅仅实现了离身智能);“智能”代表智能体(生物或机械)通过与环境产生交互后,通过自身学习,产
2023-06-30 10:01:00
更多关于科技的资讯:
DEKRA德凯百年庆典隆重举行:传承百年使命,共创安全未来
2025年,全球领先的检验检测认证机构DEKRA德凯迎来成立一百周年。值此世纪里程碑之际,DEKRA德凯亚太区于9月12日在上海隆重举行百年庆典
2025-09-16 13:38:00
中国品牌,全球奖项:及象教育双奖加身,引领银发教育“中国服务”时代
9月13日,第四届全球品牌经济大会在北京首钢国际会展中心举行,作为中国国际服务贸易交易会的重要组成部分,本届大会以“向远
2025-09-16 13:38:00
优机优补、有进有出:中国农机正迎来新的黄金时代
大众网记者 刘晓雨 通讯员 张一晓 潍坊报道当前,中国农机行业正站在转型升级的关键节点。国家通过“优机优补、有进有出”的补贴政策
2025-09-16 10:21:00
河北新闻网讯(闫丽颖、罗俊明)近日,开滦股份范各庄矿顺利完成SVG智能升级改造工程。该工程不仅破解了长期困扰安全生产的供电系统稳定性难题
2025-09-16 09:41:00
西贝真正的敌人,从来都不是罗永浩
近期最热的事,毫无疑问,罗永浩大战西贝。如果你还没关注,也没事,差评君给你简单说下来龙去脉。9月10号,罗永浩发了条微博
2025-09-16 05:14:00
江西超高压工程实现“智能”验收
本报讯(全媒体记者谢梦丽)9月12日,随着一架无人机平稳返航,国网江西省电力有限公司在赣州东500千伏输变电工程现场的全线数字化验收顺利完成
2025-09-16 06:53:00
南京天加环境攻克技术难题,“节能”和“减排”双路径绿色发展为地球控温1.5℃持续努力□南京日报/紫金山新闻记者黄琳燕当全球平均气温较工业化前水平上升超过1
2025-09-16 07:46:00
“法国经验”遇上“中国制造”,南山飞卓攻克大飞机产业链“关键一步”——全球主力民航客机今后将用上“南京造”□通讯员杨淏涵南京日报/紫金山新闻记者张希一个是欧洲排名第一的飞机精密零件制造商法国FigeacAero(下称“飞卓宇航”)
2025-09-16 07:46:00
最浪漫的潮州特产,统治美国人婚礼
凌晨3点,广东潮州。一家婚纱公司收到一封紧急邮件,屏幕那端,是美国客户的紧急恳求——“请务必保质保量,按时交货,拜托拜托”
2025-09-16 05:13:00
36氪合伙人、副总裁李政:中国产业的未来在哪?| 2025年36氪产业未来大会
9月10日,由36氪主办的2025年36氪产业未来大会在中国厦门盛大启幕。本次大会重磅携手商务部主办的“中国国际投资贸易洽谈会”
2025-09-16 01:03:00
核电“听诊器”打破卡脖子壁垒 中船集团携多款核心产品亮相烟台
齐鲁晚报·齐鲁壹点记者 于民星9月15日,2025山东清洁能源产业博览会和第18届烟台国际核电工业及装备博览会双展联动
2025-09-15 23:49:00
南方电网兴义供电局:职工自研装置投入使用 开启变电设备一键检测新模式
9月11日,在南方电网兴义供电局500千伏仁义变电站内,一套由该局文峰职工创新工作室历经3年自主研发的“无线传输型的氧化锌避雷器多组同步带电检测装置”成功投入使用
2025-09-15 23:11:00
人力资源管理专家汪江涛:以人才体系创新激活企业内生动力
文/许笑“人力资源管理的价值,在于精准识别组织痛点,通过体系搭建、机制创新与人才激活,将人力资源转化为推动企业前行的动能
2025-09-15 11:17:00
长白时评评论员 久泰平近日,围绕“预制菜”的争论持续发酵,引发广泛关注。表面上看,双方争执的焦点是“什么才算预制菜”,实则揭开了餐饮行业一个长期被回避的核心议题
2025-09-15 11:22:00
威海智造 冠军领航 | 从“千规千面”到“千舱千智”,一艘高端客滚船的“冠军制造”算法
大众网记者 宁晓洁 仇艺畅 威海报道威海湾畔,巨轮林立,焊花飞溅。这里是招商工业威海船厂的生产现场,一艘艘高端客滚船正在建设中
2025-09-15 11:26:00