我的订阅
科技

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

科学家竞相破解大型语言模型背后的谜团

类别：科技发布时间：2024-05-18 02:42:00 来源：每日看点快看

本文转自：科技日报

ChatGPT如何“思考”——

科学家竞相破解大型语言模型背后的谜团

图片来源：视觉中国

【科技创新世界潮】

◎本报记者刘霞

北京时间5月14日凌晨，美国开放人工智能研究中心（OpenAI）发布了其下一代大型语言模型GPT-4o，人工智能（AI）领域再起硝烟。

尽管AI一词已很普及，但其内部运作方式仍像黑箱操作一样，是一个谜。因为AI依赖机器学习算法，而先进的机器学习算法使用模拟人脑结构的神经网络，信息在不同神经元间传递，以人类不易理解的方式内化数据，缺乏可视化和透明度。

这个问题对ChatGPT等大型语言模型（LLM）来说尤其严重，部分原因在于它们规模庞大，有些LLM拥有数千亿甚至上万亿个参数。

英国《自然》杂志网站在15日的报道中指出，为洞悉LLM的黑箱操作，科学家正对AI系统进行逆向工程。他们扫描LLM的“大脑”，以揭示它们在做什么、如何做以及为什么这样做等谜团。

谈话疗法

由于聊天机器人可以进行对话，一些研究人员就让模型自我解释，以了解其工作原理。这种方法类似于心理学中使用的“谈话疗法”。

德国斯图加特大学计算机科学家蒂洛·哈根德夫表示，人脑和LLM都像是一个“黑箱”，而心理学有能力研究它。

去年，哈根德夫发表了一篇关于“机器心理学”的文章。他认为，通过将LLM视为人类主体，让其参与对话，可以阐明其复杂行为。

面对复杂问题，人类在潜意识里会进行分步骤推理。受此启发，谷歌团队2022年引入了“思维链提示”，以描述一种让LLM展示其“思维”的方法。

简单来说，思维链提示是一种特殊的上下文学习。不同于标准提示只给出输入—输出，思维链提示还会额外增加推理过程。

该方法在GPT-3等三个大型语言模型上都得到了验证：对比标准提示，新方法在一系列算术推理任务上的准确率都有了显著提高。但美国纽约大学研究人员的一项最新研究表明：LLM并没有利用思维链的推理能力，它只是偷偷加了计算。

美国东北大学计算机科学家戴维·鲍表示，尽管以研究人类的方式研究LLM有点奇怪，但两者的行为却以令人惊讶的方式重叠。在过去两年里，许多科学家将用于人类的问卷和实验应用于LLM，测量了其人格、推理、偏见、道德价值观、创造力、情绪、服从性等。结果显示，在许多情况下，机器能复制人类行为。但在有些情况下，它们的行为与人类行为不一样。例如，LLM比人类更容易受到暗示，其行为也会随着问题措辞的不同而发生巨大变化。

脑部扫描

一些科学家从神经科学领域汲取技巧，以此来探索LLM的内部工作原理。

为研究聊天机器人是如何进行欺骗的，美国卡内基梅隆大学计算机专家安迪·邹及其合作者询问了LLM，并观察了它们神经元的激活情况。邹指出，这有点像对人类进行脑部神经成像扫描，也有点像使用测谎仪。

研究人员多次让LLM撒谎或说实话，并测量了神经元活动模式的差异。然后，每当向模型提出一个新问题时，他们都可以观察其活动，并判断答案是否真实。在一个简单任务中，该方法的准确率超过90%。邹表示，此类系统可以实时检测出LLM不诚实行为。

鲍及其同事则开发了扫描和编辑人工智能神经网络的方法，包括一种他们称之为因果追踪的技术，以确定AI“大脑”中以特定方式回答问题的部分。

鲍指出，人工神经网络的好处在于，可以在它们身上做神经科学家梦寐以求的实验，比如可以观察每一个神经元、运行数百万次网络、进行各种疯狂的测量和干预，且做这些都不必获得同意书。

打破不可解释性

邹和鲍等人提出LLM扫描技术采用自上而下的方法，将概念或事实归因于潜在的神经表征。还有一些科学家则使用自下而上的方法，即观察神经元并询问它们代表什么。

神经元的不可解释性，一直是AI领域的“老大难”问题。2023年，来自Anthropic公司的一个团队提出了一种方法，成功将512个神经元分解成了4096个可解释特征，从而让其具有了可解释性。

研究人员表示，他们这一方法很有可能克服AI不可解释性这一巨大障碍。一旦人类了解LLM工作原理，就能很容易地判断其是否安全，从而决定它是否应该被社会和企业采用。

不过，邹表示，尽管这种方法很有价值，但不太适合解释更复杂的AI行为。

尽管研究人员仍在努力弄清楚AI如何工作，但人们越来越达成一致意见：AI公司应该努力为其模型提供解释，政府也应该制定相关法规来执行这一点。

以上内容为资讯信息快照，由td.fyun.cc爬虫进行采集并收录，本站未对信息做任何修改，信息内容不代表本站立场。

快照生成时间：2024-05-18 05:45:10

本站信息快照查询为非营利公共服务，如有侵权请联系我们进行删除。

信息原文地址：

更多关于谜团,科学家,模型,背后,语言,科学的资讯：

科学家新理论揭开宇宙起源之谜

...理、天文学和哲学问题。然而，就在不久前，一群勇敢的科学家借助最先进的技术和仪器，揭开了宇宙起源的一角，为我们提供了一种新的理论，引发了无数科学界的讨论与热议。新理论的背景介绍

2023-10-31 15:12:00

一些人在ChatGPT中瞥见了AGI 另一些人：啥也不是

...医学院考试中的表现来推广 GPT-4，但研究人类智能方面的科学家表示，GPT-4 的卓越能力在关键方面与我们人类不同。众所周知，模型倾向于编造事实，但围绕这点也存在很大分歧。

2023-05-11 14:32:00

纽约大学教授 Nature 发文：为了科学界的未来

...作为一名正在使用并教授如何使用这些模型的政治和数据科学家，我认为学者们应该保持警惕，因为目前最受大众追捧的语言模型仍然是私有且封闭的，即由公司运营，他们不会披露基本模型的具体

2023-05-10 15:10:00

全球首个多模态地理科学大模型“坤元”发布：可据指令生成专业地

...系。此外，他们还将打造地理科研协作大平台，为每一位科学家和科研团队提供专属的地理大模型服务，通过共享数据、模型与研究思路等方式促进全球范围内的科研合作与知识交流，共同推动地理

2024-09-19 19:53:00

胎儿在子宫内踢腿谜团解开

...电（实习记者张佳欣）胎儿在子宫内踢腿的原因终于被科学家解开了。日本东京大学的一个研究小组表示，这种自发动作有助于它们感觉运动系统的发育，其中包括感觉器官、神经系统和运动控制

2022-12-30 01:02:00

理解并超越大模型需要数学“应战”

...茂松表示，三五年内有望破解智能涌现之谜理解并超越大模型需要数学“应战” ■本报记者许琦敏瓦特改良蒸汽机后大约100年，热力学三定律才阐明其机理。眼下，Chat

2023-07-26 06:00:00

深圳科学家利用人工智能揭秘动物社交语言

...究成果登上了国际顶级学术期刊《自然—机器智能》，为科学家们解开动物社交行为的奥秘带来了新的视角。动物社交行为一直是神经科学探索的难题。想象一下，当鸟儿群集并同步起飞时是如何无

2024-01-11 04:04:00

科学家打造多模态模型，7B和1.3B小模型均开源，可部署手机

在最近一项研究中，DeepSeek-AI 团队针对多模态大模型展开了深入探索。选择这一研究方向，背后有着多重考量。最初，该团队围绕是否聚焦于多模态生成、多模态理解、或是两者的统一

2024-04-10 10:25:00

“链氪”探链丨数字诗人李白是怎么诞生的？

...年的人工智能创新中心。廉士国是创新中心首席人工智能科学家，他给我们现场拆解了人工智能大模型的运作过程。生成一个数字诗人李白要分三步：先由文字生成图片，图片生成视频，文字再生成

2024-11-27 14:22:00

更多关于科技的资讯：

日亏700万日产汽车叫停本田合并

2025-02-16 14:53:00

直降4.3万！别克GL8陆上公务舱限时优惠：18.99万元起

2025-02-16 14:53:00

节后多地机票节后低至一两折上海飞三亚仅需199元

2025-02-16 14:53:00

中国电影的海外困境藏在百亿《哪吒2》中

2025-02-16 15:23:00

画面离谱！韩国多名空姐打开应急舱门还站机翼穿制服自拍航司官

2025-02-16 15:23:00

男子利用15分钟内免停车费钻漏洞：逃费71次少掏2500元

2025-02-16 15:23:00

单张不到1毛钱！维达金盏花湿厕纸大促：35元到手6包

2025-02-16 15:23:00

果粉再等等！新版AI Siri可能要到iOS 18.5了

2025-02-16 15:53:00

旗舰机性能对决！三星S25 Ultra罕见碾压iPhone

2025-02-16 15:53:00

零跑公布智驾计划：一季度实现城快/高架NAP全国覆盖

2025-02-16 15:53:00

比芝麻还小！广州发现全球新物种“海珠微瓢虫”

2025-02-16 15:53:00

北美首日票房超2200万《哪吒2》距全球票房前10仅差不到

2025-02-16 15:53:00

头条订阅服务

科学家竞相破解大型语言模型背后的谜团