• 我的订阅
  • 科技

OpenAI 开发新工具,试图解释语言模型的行为

类别:科技 发布时间:2023-05-10 15:34:00 来源:浅语科技

语言模型是一种人工智能技术,可以根据给定的文本生成自然语言。OpenAI的GPT系列语言模型是目前最先进的代表之一,但IT之家注意到它们也有一个问题:它们的行为很难理解和预测。为了让语言模型更透明和可信,OpenAI正在开发一种新工具,可以自动识别语言模型中哪些部分对其行为负责,并用自然语言进行解释。

OpenAI 开发新工具,试图解释语言模型的行为

这个工具的原理是利用另一个语言模型(也就是OpenAI最新的GPT-4)来分析其他语言模型(比如OpenAI自己的GPT-2)的内部结构。语言模型由许多“神经元”组成,每个神经元都可以观察文本中的某种特定模式,并影响模型下一步的输出。例如,给定一个关于超级英雄的问题(比如“哪些超级英雄有最有用的超能力?”),一个“漫威超级英雄神经元”可能会提高模型提到漫威电影中特定超级英雄的概率。

OpenAI的工具就是利用这种机制来分解模型的各个部分。首先,它会将文本序列输入到被评估的模型中,并等待某个神经元频繁地“激活”。然后,它会将这些高度活跃的神经元“展示”给GPT-4,并让GPT-4生成一个解释。为了确定解释的准确性,它会提供给GPT-4一些文本序列,并让它预测或模拟神经元的行为。然后它会将模拟的神经元的行为与实际神经元的行为进行比较。

“通过这种方法,我们基本上可以为每个神经元生成一些初步的自然语言解释,并且还有一个分数来衡量这些解释与实际行为的匹配程度。”OpenAI可扩展对齐团队负责人JeffWu说,“我们使用GPT-4作为过程的一部分,来生成对神经元在寻找什么的解释,并评估这些解释与它实际做什么的匹配程度。”

研究人员能够为GPT-2中所有307,200个神经元生成解释,并将它们编译成一个数据集,与工具代码一起在GitHub上以开源形式发布。像这样的工具有朝一日可能被用来改善语言模型的性能,比如减少偏见或有害言论。但他们也承认,在真正有用之前,还有很长的路要走。该工具对大约1000个神经元的解释很有信心,这只是总数的一小部分。

有人可能会认为,这个工具实际上是GPT-4的广告,因为它需要GPT-4才能运行。但Wu说,这并不是这个工具的目的,它使用GPT-4只是“偶然”的,而且,相反它显示了GPT-4在这方面的弱点。他还说,它并不是为了商业应用而创建的,并且理论上可以适应除了GPT-4之外的其他语言模型。

“大多数解释的分数都很低,或者没有解释太多实际神经元的行为。”Wu说,“很多神经元的活动方式很难说清楚——比如它们在五六种不同的东西上激活,但没有明显的模式。有时候有明显的模式,但GPT-4却无法找到。”

更不用说更复杂、更新、更大的模型,或者可以浏览网页获取信息的模型了。但对于后者,Wu认为,浏览网页不会太改变工具的基本机制。他说,它只需要稍微调整一下,就可以弄清楚神经元为什么决定进行某些搜索引擎查询或访问特定网站。

“我们希望这将开辟一个有前途的途径,来以一种自动化的方式解决可解释性问题,让其他人可以建立在上面并做出贡献。”Wu说,“我们希望我们真的能够对这些模型的行为有好的解释。”

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-05-10 17:45:08

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

作者|沈筱编辑|石亚琼在AI大模型创业“学院派”中,清华系占据了半壁江山。智谱AI、聆心智能、面壁智能、深言科技、循环智能,每一个项目都备受瞩目。而近期,这股创新创业的热潮也正在
2023-05-22 11:16:00
红帽开发者分享新的ai工具
...tive(日志侦探)。这是一款正在开发的新工具,将利用AI模型来帮助分析RPM包构建失败的原因。IT之家注:RPM(RedHatPackageManager)是一种用于Linux系统的互联网下载包的打包及安装工具
2024-01-19 03:02:00
...释错误等任务。然而,该AI服务不附带其自己的大型语言模型,因此用户需要提供自己的AzureOpenAI服务端点和密钥才能使用TerminalChat功能
2023-11-18 20:47:00
李彦宏:大模型场景下开源是最贵的,多模态是通往AGI的必经之路
...是尽可能为大家提供所需的开发工具,这包括了1个基础模型系列和三大AI开发工具,“今天的中国,有10亿互联网用户,有强大的基础大模型,有足够多的AI应用场景,有全球最完备的产业
2024-04-16 17:57:00
iPhone可跑2B小钢炮!谷歌Gemma 2来袭,最强显微镜剖解LLM大脑
【新智元导读】谷歌DeepMind的小模型核弹来了,Gemma 2 2B直接击败了参数大几个数量级的GPT-3.5和Mixtral 8x7B
2024-08-02 09:55:00
OpenAI推出GPT商店,人人可0代码自制智能体,业界看好成为下一个苹果
...—更长的上下文长度、更强的控制、知识升级、多模态、模型微调定制和更高的速率限制。GPT-4的付费服务将“加量不加价”
2023-11-07 15:48:00
Runway开发通用世界模型,想让AI更好地模拟世界
...Gen-1、Gen-2的开发商Runway突然宣布组建团队开发通用世界模型(General World Models
2023-12-22 19:48:00
李彦宏:开源模型将会越来越落后 | 最前线
...来源:百度本次发布会的重磅发布,简单而言就是:基础模型全面更新,推出4.0工具版,百度还带来了三大AI开发工具,对应不同的开发场景。“它们组成了一个工具箱,支持开发者打包带走
2024-04-17 11:51:00
国泰君安证券:具身智能,人工智能的下一个浪潮
...Disembodiment),指的是认知与身体解耦(ChatGPT为代表的大模型就仅仅实现了离身智能);“智能”代表智能体(生物或机械)通过与环境产生交互后,通过自身学习,产
2023-06-30 10:01:00
更多关于科技的资讯:
江南时报讯 近日,苏州农商银行与人保财险苏州市分公司深化协同,成功落地全国首单银保合作“科创贷”。该企业作为国家级高新技术企业
2026-02-10 21:42:00
西秀食品“双星”冲刺首季“开门红”
连日来,位于西秀区的贵州安顺云鹫食品有限公司和贵州好味达食品有限公司呈现一派热火朝天的生产景象。作为本土食品行业的标杆企业
2026-02-10 22:10:00
锦江国际集团启动马年春节多元促消费活动,激发假日市场新活力
马年春节临近,锦江国际集团依托“吃、住、行、游”全产业链优势,为海内外宾客准备了丰富的年娱、年味项目,陪伴大家一起过个精彩中国年
2026-02-10 17:24:00
潮新闻讯 目光所及,即是世界。此刻,我们站在迈向高水平科技自立自强的时代关口。“科技创新和产业创新深度融合”“概念验证”“中试平台”“职务科技成果赋权”“资产单列管理”“技术经理人”等成为了中国科技成果转化行业的热词
2026-02-10 18:06:00
中国消费者报北京讯(记者吴博峰)记者近日从江苏省储能行业协会获悉,即将于今年5月举办的CESC2026第四届储能大会主论坛将汇聚行业各方人士
2026-02-10 18:33:00
中国消费者报报道(记者何永鹏)近日,由市场监管总局发展研究中心、中国社会科学院财经战略研究院课题组联合完成的《2025直播电商行业发展白皮书》(以下简称《白皮书》)正式发布
2026-02-10 19:03:00
2025年池州市累计完成以旧换新交易11.24万笔 带动社会消费22.6亿元
大皖新闻讯 记者从2月9日召开的池州市提质增效实施消费品以旧换新政策新闻发布会上获悉,2025年,池州市累计完成消费品以旧换新交易11
2026-02-10 18:14:00
记者今天(2月10日)了解到,市场监管总局(国家标准委)批准发布一批重要国家标准。在新兴领域方面,发布脑机接口、数字孪生等5项国家标准
2026-02-10 14:15:00
滨州移动科技赋能年货盛会 铸就网络保障新典范
鲁网2月10日讯2026年2月6日至8日,“购在中国·2026滨州迎新春消费季暨乐购滨州年货大集”在滨州市全民健康文化中心体育场南广场盛大举办
2026-02-10 15:09:00
西北工业大学科研团队在脑机接口关键领域取得新突破
想象一下,当瘫痪者用意念操控机械臂,稳稳端起水杯;当失语者的思维被直接“翻译”成流畅语音;当帕金森患者的颤抖经神经调控逐渐平息……这些曾出现在科幻电影里的场景
2026-02-10 16:06:00
创新潮涌!温州乐清科技创新指数连续八年领跑全省
日前,位于温州乐清北白象镇中方智能园区的温州合力自动化仪表有限公司,成功研发出AI智能物联直行程电动执行器。作为流体控制领域的领军企业
2026-02-10 16:20:00
诺特兰德公益创新获认可,一举摘得公益节三项荣誉
鲁网2月10日讯1月22日至23日,第十五届公益节暨2025ESG影响力年会在北京举行。全球膳食营养品牌诺特兰德凭借其在公益领域的持续深耕与创新实践
2026-02-10 16:22:00
中国消费者报重庆讯(记者刘文新)2月6日,重庆举行低空经济重大成果发布会,发布《重庆市低空装备产业链产品名录》(2025版)
2026-02-10 16:03:00
中交一航局二公司检测中心研发一款基于若依结构的档案管理系统
鲁网2月10日讯近日,中交一航局二公司检测中心研发一款基于若依结构的档案管理系统,该系统依托若依架构精准破解行业痛点,集成RBAC权限管控
2026-02-10 15:09:00
量子技术赋能电网 安徽筑牢民生用电安全线
大皖新闻讯 今年1月,国内首个量子智慧台区在马鞍山市当涂县乌溪镇七房村正式投运。这是我国首次将量子技术与柔性互联技术规模化应用于乡村电网
2026-02-10 11:19:00