• 我的订阅
  • 科技

OpenAI 开发新工具,试图解释语言模型的行为

类别:科技 发布时间:2023-05-10 15:34:00 来源:浅语科技

语言模型是一种人工智能技术,可以根据给定的文本生成自然语言。OpenAI的GPT系列语言模型是目前最先进的代表之一,但IT之家注意到它们也有一个问题:它们的行为很难理解和预测。为了让语言模型更透明和可信,OpenAI正在开发一种新工具,可以自动识别语言模型中哪些部分对其行为负责,并用自然语言进行解释。

OpenAI 开发新工具,试图解释语言模型的行为

这个工具的原理是利用另一个语言模型(也就是OpenAI最新的GPT-4)来分析其他语言模型(比如OpenAI自己的GPT-2)的内部结构。语言模型由许多“神经元”组成,每个神经元都可以观察文本中的某种特定模式,并影响模型下一步的输出。例如,给定一个关于超级英雄的问题(比如“哪些超级英雄有最有用的超能力?”),一个“漫威超级英雄神经元”可能会提高模型提到漫威电影中特定超级英雄的概率。

OpenAI的工具就是利用这种机制来分解模型的各个部分。首先,它会将文本序列输入到被评估的模型中,并等待某个神经元频繁地“激活”。然后,它会将这些高度活跃的神经元“展示”给GPT-4,并让GPT-4生成一个解释。为了确定解释的准确性,它会提供给GPT-4一些文本序列,并让它预测或模拟神经元的行为。然后它会将模拟的神经元的行为与实际神经元的行为进行比较。

“通过这种方法,我们基本上可以为每个神经元生成一些初步的自然语言解释,并且还有一个分数来衡量这些解释与实际行为的匹配程度。”OpenAI可扩展对齐团队负责人JeffWu说,“我们使用GPT-4作为过程的一部分,来生成对神经元在寻找什么的解释,并评估这些解释与它实际做什么的匹配程度。”

研究人员能够为GPT-2中所有307,200个神经元生成解释,并将它们编译成一个数据集,与工具代码一起在GitHub上以开源形式发布。像这样的工具有朝一日可能被用来改善语言模型的性能,比如减少偏见或有害言论。但他们也承认,在真正有用之前,还有很长的路要走。该工具对大约1000个神经元的解释很有信心,这只是总数的一小部分。

有人可能会认为,这个工具实际上是GPT-4的广告,因为它需要GPT-4才能运行。但Wu说,这并不是这个工具的目的,它使用GPT-4只是“偶然”的,而且,相反它显示了GPT-4在这方面的弱点。他还说,它并不是为了商业应用而创建的,并且理论上可以适应除了GPT-4之外的其他语言模型。

“大多数解释的分数都很低,或者没有解释太多实际神经元的行为。”Wu说,“很多神经元的活动方式很难说清楚——比如它们在五六种不同的东西上激活,但没有明显的模式。有时候有明显的模式,但GPT-4却无法找到。”

更不用说更复杂、更新、更大的模型,或者可以浏览网页获取信息的模型了。但对于后者,Wu认为,浏览网页不会太改变工具的基本机制。他说,它只需要稍微调整一下,就可以弄清楚神经元为什么决定进行某些搜索引擎查询或访问特定网站。

“我们希望这将开辟一个有前途的途径,来以一种自动化的方式解决可解释性问题,让其他人可以建立在上面并做出贡献。”Wu说,“我们希望我们真的能够对这些模型的行为有好的解释。”

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-05-10 17:45:08

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

作者|沈筱编辑|石亚琼在AI大模型创业“学院派”中,清华系占据了半壁江山。智谱AI、聆心智能、面壁智能、深言科技、循环智能,每一个项目都备受瞩目。而近期,这股创新创业的热潮也正在
2023-05-22 11:16:00
红帽开发者分享新的ai工具
...tive(日志侦探)。这是一款正在开发的新工具,将利用AI模型来帮助分析RPM包构建失败的原因。IT之家注:RPM(RedHatPackageManager)是一种用于Linux系统的互联网下载包的打包及安装工具
2024-01-19 03:02:00
...释错误等任务。然而,该AI服务不附带其自己的大型语言模型,因此用户需要提供自己的AzureOpenAI服务端点和密钥才能使用TerminalChat功能
2023-11-18 20:47:00
李彦宏:大模型场景下开源是最贵的,多模态是通往AGI的必经之路
...是尽可能为大家提供所需的开发工具,这包括了1个基础模型系列和三大AI开发工具,“今天的中国,有10亿互联网用户,有强大的基础大模型,有足够多的AI应用场景,有全球最完备的产业
2024-04-16 17:57:00
iPhone可跑2B小钢炮!谷歌Gemma 2来袭,最强显微镜剖解LLM大脑
【新智元导读】谷歌DeepMind的小模型核弹来了,Gemma 2 2B直接击败了参数大几个数量级的GPT-3.5和Mixtral 8x7B
2024-08-02 09:55:00
OpenAI推出GPT商店,人人可0代码自制智能体,业界看好成为下一个苹果
...—更长的上下文长度、更强的控制、知识升级、多模态、模型微调定制和更高的速率限制。GPT-4的付费服务将“加量不加价”
2023-11-07 15:48:00
Runway开发通用世界模型,想让AI更好地模拟世界
...Gen-1、Gen-2的开发商Runway突然宣布组建团队开发通用世界模型(General World Models
2023-12-22 19:48:00
李彦宏:开源模型将会越来越落后 | 最前线
...来源:百度本次发布会的重磅发布,简单而言就是:基础模型全面更新,推出4.0工具版,百度还带来了三大AI开发工具,对应不同的开发场景。“它们组成了一个工具箱,支持开发者打包带走
2024-04-17 11:51:00
国泰君安证券:具身智能,人工智能的下一个浪潮
...Disembodiment),指的是认知与身体解耦(ChatGPT为代表的大模型就仅仅实现了离身智能);“智能”代表智能体(生物或机械)通过与环境产生交互后,通过自身学习,产
2023-06-30 10:01:00
更多关于科技的资讯:
第三届东北书博会丨5号馆,潮人必冲!
书博会不止有书香,还有能让潮人必冲的宝藏展馆,那就是5号馆·吉物馆——模型艺术与IP文创交易馆。这里把科幻、军事、机甲的浪漫焊在了现场
2026-03-27 23:09:00
联想携手中国一汽 共筑汽车行业智能制造新动能
当前,全球传统工业迈入智能化新时代,制造业成为我国培育新质生产力的主阵地。汽车制造作为典型的复杂离散制造行业,在智能化
2026-03-27 23:09:00
潮新闻讯 浙江最近掏了2000万元,专门用来请人“来浙江、游浙江、看演出”。记者从省财政厅了解到,这笔钱是在常规资金基础上新增的
2026-03-27 21:11:00
【宅男财经|专家面对面】近日,国内DDR5内存价格出现下跌,不少人关心,这是短期个别现象,还是内存紧缺势头真的缓和了?工信部信息通信经济专家委员会委员盘和林表示
2026-03-27 20:43:00
【宅男财经|专家面对面】废旧手机回收市场迎来“火热期”,回收价格普遍上涨。iPhone4回收价格更是暴涨80倍。如何防范卖手机导致数据泄露
2026-03-27 20:43:00
源于澳洲,循证为先——KOOVS蔲维斯正式启航中国市场
重磅官宣!澳洲专注女性健康领域的专业品牌KOOVS蔲维斯正式登陆中国市场!依托国际前沿的盆底健康研究成果,打造适配女性生理需求的盆底健康产品系列
2026-03-27 21:10:00
旅游场景成为新质生产力落地应用的最佳验证场
3月26日,中国社会科学院财经战略研究院、中国社会科学院旅游研究中心与社会科学文献出版社在京共同组织“迈向‘十五五’的中国旅游业——第24本《旅游绿皮书》发布会”
2026-03-27 17:30:00
AIGC赋能设计OPC实战工作坊圆满举办
江南时报讯3月24日,2026青苔设计OPC训练营系列活动——“AIGC赋能设计OPC实战工作坊”在青苔国际工业设计村成功举办
2026-03-27 17:43:00
福州交通新能源公司获数商证书 “双证”合力促进数据产业生态建设
福州新闻网3月27日讯(记者 傅亦静)近期,福州交通新能源科技有限公司获得由福建大数据交易所颁发的数商证书,加上此前获得的全省首张数据产权登记证书
2026-03-27 17:50:00
中新经纬3月27日电 (谢婧雯 周奕航)“元宇宙并未‘退烧’,而是其概念被不断迭代的新技术名称所掩盖。”2026中关村论坛年会期间
2026-03-27 17:54:00
当无人驾驶小巴化身移动咖啡店亮相F1赛场,当无人配送车穿梭城市大街小巷,当隧道打孔机器人在轨道交通工地精准作业……这些带着鲜明“高新造”标签的未来科技产品
2026-03-27 17:55:00
全球首款侵入式脑机接口产品获批 中原医学科学城前瞻布局未来产业
大河网讯 近日,全球首款侵入式脑机接口医疗器械获准上市,并迅速完成国家医保编码赋码,这标志着脑机接口技术正式从“实验室蓝图”迈入“临床应用快车道”
2026-03-27 18:27:00
京东超市与蓝月亮达成战略合作 三年冲刺50亿销售目标
多彩贵州网讯 3月27日,京东超市与蓝月亮签订战略合作协议,双方将围绕产品运营、全渠道布局、绿色可持续发展、营销与品牌共建四大方向深度合作
2026-03-27 18:52:00
在边界处眺望——读《人工智能的边界——李德毅学术思想文选》有感
读《三体》的时候,我曾被“思想钢印”这个概念击中——当一种信念可以被物理性地写入大脑,意识与信仰的边界究竟在哪里?而看《黑客帝国》
2026-03-27 19:03:00
培育壮大新兴产业 前瞻布局未来产业 2026中关村论坛年会上各类新技术、新产品齐亮相
科技企业展示新项目、新技术,嘉宾互动交流,企业负责人分享创新思路……2026中关村论坛年会上,科技创新成为参会者关注的焦点之一
2026-03-27 19:13:00