• 我的订阅
  • 科技

类人神经网络再进一步!DeepMind最新50页论文提出AligNet框架:用层次化视觉概念「对齐」人类

类别:科技 发布时间:2024-09-23 10:00:00 来源:新智元

类人神经网络再进一步!DeepMind最新50页论文提出AligNet框架:用层次化视觉概念「对齐」人类

【新智元导读】DeepMind最近的研究提出了一种新框架AligNet,通过模拟人类判断来训练教师模型,并将类人结构迁移到预训练的视觉基础模型中,从而提高模型在多种任务上的表现,增强了模型的泛化性和鲁棒性,为实现更类人的人工智能系统铺平了道路。

近年来,深度学习在人工智能领域,如自然语言处理和计算机视觉方面取得了快速进展,但即便是最强大的模型,也经常会在那些,对于人类说非常简单的case上折戟。

人类感知对环境变化具有鲁棒性,并能在不同的视觉设置中泛化,相比之下,对于深度学习模型来说,如果训练和测试数据集之间的分布发生偏移,其性能往往会急剧下降。

人类在判断视觉相似性时往往能够很好地校准自己的判断,即人类对某个问题的确定性往往与预测准确率成正比,而AI系统则过于自信,即使在预测错误时也表现出高度的确定性。

所以说,在真正实现通用人工智能之前,深度学习模型和人类之间仍然存在诸多差异需要调和、对齐。

值得思考的是,神经网络训练和人类学习在根本上有所不同,其无法像人类一样稳健地泛化,是否是因为其底层表征的相似性的问题?现代学习系统要表现出更像人类的行为,还缺少什么?深度学习模型在概念层次结构的各个层次上缺乏这种全局组织,是否可能导致了这些模型的前述弱点?

最近,DeepMind等机构的研究人员联合发布了一篇长达50页的论文,提出了一个可能导致AI模型与人类表现存在差异的原因:人类概念知识是从精细到粗尺度进行分层组织的,而深度学习模型表征无法捕捉到人类感知的多层次概念结构。

类人神经网络再进一步!DeepMind最新50页论文提出AligNet框架:用层次化视觉概念「对齐」人类

论文链接:https://arxiv.org/pdf/2409.06509

虽然说模型表征在一定程度上可以对局部视觉和语义特征(例如,不同犬种的纹理或颜色)进行编码,共享实体之间的人类感知相似性结构,但对于在视觉和语义上更为不同的概念之间的全局关系(例如,狗和鱼都是有生命的,但在视觉上根本不相似)的建模则远没有那么系统化。

然而,人类的神经表示是由全局特征(如生命性)组织起来的,并且在多个更细的尺度上捕捉微妙的语义关系。

为了解决这种不一致问题,研究人员提出了一个新的框架,通过模拟大量类似人类的相似性判断数据集,来提高模型与人类的对齐度。

首先训练一个教师模型来模仿人类的判断,然后将这种类人的结构(human-link structure)表征迁移到预训练后的视觉基础模型中,从而使这些与人类对齐的模型在包括一个新的跨越多个语义抽象层次的人类判断数据集在内的一系列相似性任务中,更准确地近似人类的行为和不确定性。

结果显示,该模型在各种机器学习任务上表现更好,提高了泛化性和分布外的鲁棒性,此外,将额外的人类知识注入神经网络后,学习到的表征更符合人类认知,也更实用,为更强大、可解释和类人的AI系统铺平了道路。

此外,文中还提供了一套开源的视觉模型,通过软对齐编码了分层的人类知识,其普遍意义在于使科学、医学和工业能够使用更类人和鲁棒的视觉模型进行下游应用,任何研究人员或从业者都可以无限制地使用。

总的来说,这项工作不仅有助于更好地理解人工智能与人类智能之间的主要差异,而且还提出了一种可能对实现类似人类智能的人工智能至关重要的原则,即关注人类知识中的多分辨率关系结构。

AligNet框架

类人神经网络再进一步!DeepMind最新50页论文提出AligNet框架:用层次化视觉概念「对齐」人类

研究人员首先使用仿射变换来对齐神经网络模型表示与人类在三元组异类任务中的语义判断,利用THINGS数据集开发了一个人类判断的教师模型;

与此同时,通过保持模型的局部表征结构来规范对齐过程,并额外利用人类恢复的不确定性度量来改善模型校准。

然后将该模型应用于ImageNet,将其潜在表示聚类到语义上有意义的类别,从而能够生成大量的语义相似性三元组,研究人员将该数据集称为AligNet。

为了将这种精心构造的类人相似性结构信息迁移到预训练的神经网络基础模型中,研究人员引入了一种基于Kullback-Leibler散度的新目标函数,将语义信息蒸馏到一个学生视觉基础模型(VFM)中。

实验结果

类人神经网络再进一步!DeepMind最新50页论文提出AligNet框架:用层次化视觉概念「对齐」人类

为了验证AligNet框架的有效性,即是否有助于提高模型与人类之间的对齐度,研究人员验证了模型在THINGS三元组异类(triplet odd-one-out )数据上的表现接近人类噪声上限的66.67%。在对教师模型表示应用不确定性蒸馏优化后,可以观察到在THINGS数据中的所有三元组中,三元组异类响应与人类响应的一致性达到了61.7%

此外,研究人员还发现,在模型生成的三元组异类响应数据上微调视觉基础模型后,所有模型的表现都有了显著的提升,无论预训练任务和用于训练基础模型的目标函数是什么,或是其他认知相似性任务和相似性度量方式,软对齐技术都能够提高模型在特定任务上的表现,使模型的行为更加接近人类的思维方式。

为了验证软对齐技术是否能够使模型的内部表示更好地反映人类概念知识的层次结构,研究人员利用众包方式收集了一个全新的人类语义判断评估数据集Levels,设计了三种不同难度级别的三元组异类任务,包括需要在大类别间判断异类的全局粗粒度语义任务,需要在相同类别内识别微妙差异的局部细粒度语义任务,以及测试识别不同类别边界的能力的类别边界任务。

实验结果正如预期,研究人员发现模型在预测涉及视觉或语义重叠较少的实体之间关系(即更抽象的)时表现最差。

类人神经网络再进一步!DeepMind最新50页论文提出AligNet框架:用层次化视觉概念「对齐」人类

软对齐技术也能显著改变了模型的内部表示,使其在对齐后更加相似,更好地反映了人类对语义类别层次结构的理解。

这种变化的原因在于两个主要因素:首先,模型在对齐过程中生成的标签更贴近人类的判断和不确定性,尤其是在处理更抽象的类别层次时;其次,用于生成三元组的聚类过程也考虑了这种层次结构,倾向于将来自相同下位或基本级别类别的图像配对,而将来自不同基本级别或上位类别的图像作为异类项。

因此,软对齐不仅在聚类过程中,也在标记过程中,以多种方式嵌入了全局结构,从而提高了模型的一致性和类人行为。

研究人员还探讨了软对齐技术如何影响模型在机器学习任务中的泛化能力和面对未知分布数据时的鲁棒性。

为了评估模型表示的质量,首先固定神经网络模型的权重,并在这些固定权重之上训练一个线性分类器,而不是对整个模型进行训练或微调,从而可以更直接地评估模型的内部表示,而不受模型其他部分的影响。

研究者们特别关注了模型在以下三个方面的表现:单次分类任务,考验了模型在只有极少量样本的情况下对新类别的识别能力;分布偏移,即模型在面对与训练数据分布不同的数据时的表现;以及分布外鲁棒性,即模型在面对完全未知类型的数据时的稳定性和鲁棒性。

结果显示,将人类和神经网络模型的表示对齐有助于更好地泛化、转移到新任务和数据上,并增强了模型的鲁棒性,即对齐对于实际改善深度学习是非常有帮助的。

总之,该工作有助于更好地理解人工与自然智能之间的关键差异,实验结果也展示了对齐模型和人类的原则,即专注于人类知识的多分辨率关系结构,可能对于解决实现类人AI的更一般问题至关重要。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-09-23 11:45:07

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

超低功耗类脑芯片问世,中国团队研发出毫瓦级Speck系统
...类大脑看作是一个 AI 系统,能够运行极其繁杂和庞大的神经网络,但其总功耗仅为 20W 左右,功耗远小于现有的 AI 系统。人脑具有较高的能效比,这主要得益于人脑拥有高效的能
2024-06-04 11:57:00
中国科研团队研发出低功耗类脑神经形态系统级芯片
...者李国齐研究员介绍说,人脑能够运行非常复杂且庞大的神经网络,总功耗却仅为20瓦,远小于现有的人工智能系统。因此,在算力比拼加速,能耗日益攀升的今日,借鉴人脑的低功耗特性发展新
2024-06-01 20:49:00
比人工智能更可怕的是……
...现在还非常活跃,经常出来谈话。他最著名的工作是卷积神经网络,这两人与加拿大蒙特利尔大学的本·吉奥共同获得了2018年的图灵奖。 2. 数学原理说了这么多历史和人物,计算机到
2023-08-12 13:56:00
...们说,三个资料库框架都使用神经符号方法——一种结合神经网络的人工智能结构。神经网络就是采用经典的类似程序的逻辑方法,模仿人类大脑结构的机器学习算法集合。编码更加智能大语言模型
2024-06-12 18:15:00
科学家为脉冲神经网络引入新架构,为超大模型奠定基础
...一种类脑计算范式,一般是指在神经形态芯片上运行脉冲神经网络(Spiking Neural Network,SNN)
2024-03-18 10:41:00
国泰君安证券:具身智能,人工智能的下一个浪潮
...并催动了联接主义的发展,形成了包括多层感知机、前向神经网络、循环神经网络,直至今日风靡学术界与产业界的深度神经网络等多种方法。这种用人工神经网络模拟认知过程的方法在适应、泛化
2023-06-30 10:01:00
科学家揭示神经元连接机制,证明人类神经元连接方式支持高阶计算
...影响网络内的计算,研究人员使用数学分析和模拟的人工神经网络,并发现这些原理可以扩展一个网络的维数。具体来说,他们证明了在递归神经网络中,与随机连接相比,局部前馈连接可以提高网
2024-06-29 09:23:00
一个AI的自白
...降临,点亮了AGI(通用人工智能),并涉及大模型、深度神经网络、Transformer、AIGC、涌现效应等一系列技术前沿
2023-09-08 03:55:00
马斯克脑机接口公司新进展!将脑机芯片植入第二位受试者脑内获允
...形态系统级芯片Speck,展示了神经形态计算在融合高抽象层次大脑机制时的天然优势,相关研究日前在线发表于国际学术期刊《自然·通讯》。“人脑是非常复杂庞大的神经网络系统,总功耗
2024-06-02 13:17:00
更多关于科技的资讯:
中新经纬2月11日电 据国家市场监督管理总局网站消息,2月4日,国务院反垄断反不正当竞争委员会印发施行《关于公用事业领域的反垄断指南》(以下简称《指南》)
2026-02-11 20:18:00
季季有主题,周周有优惠!2026年河北省电影惠民观影促消费活动启动
河北日报客户端讯(记者肖煜)为积极响应落实国家电影局全国电影惠民消费季安排,进一步激活河北电影市场消费潜力,丰富群众文化生活
2026-02-11 22:05:00
2025国际宠物博览会落幕:Benarmi倡导全生命周期健康管理
12月20日,2025国际宠物博览会在北京市平谷区博物馆、体育中心拉开帷幕,汇聚全球名宠、产业企业与创新项目,集中展现宠物经济的前沿动态与发展趋势
2026-02-11 20:08:00
“民生科幻”领军人吴楚新作《背叛文明》出版,聚焦星际外交博弈
如果高等文明的馈赠是一颗带毒的蜜糖,那人类是否有智慧拒绝唾手可得的诱惑?当思想需要向未来跨出一大步时,阅读科幻依然是当下最高效的途径
2026-02-11 17:22:00
随着云计算、大数据、人工智能等数智技术的迅猛发展,传统劳动形态正经历着前所未有的变革。工作场所的虚拟化、劳动时间的弹性化以及用工关系的多元化
2026-02-11 17:31:00
厦门城市可信数据空间开放试运行推出“马上有数”进驻激励计划 首发5个月资源免费共享东南网2月11日讯 (海峡导报记者 康泽辉) 近日
2026-02-11 17:50:00
元梦空间荣膺两项大奖 闪耀2025人工智能未来设计大赛
2025年11月10日,由工业和信息化部工业文化发展中心主办的2025“人工智能未来设计大赛”全国总决赛在山西太原圆满落幕
2026-02-11 17:50:00
【寒假摘镜总动员】选择哪种近视手术方式?——济南普瑞眼科王晓雪主任为您专业解析
视力是体检中至关重要的一环。选择一种既安全稳定、又符合体检标准的近视手术方式,是实现梦想的关键一步。济南普瑞眼科作为山东省首批蔡司全飞秒4
2026-02-11 17:51:00
潮新闻讯 随着人工智能兴起,数据要素领域的生产性服务业,规模正迅速壮大。近日,浙江省委副书记、省长刘捷在杭州专题调研服务业发展工作
2026-02-11 17:58:00
俊小白与上海吴淞材料实验室联合成立实验室
中国消费者报北京讯(记者孙蔚)近日,上海吴淞材料实验室与国货科创口腔护理品牌俊小白联合成立的个人护理功能介孔材料联合实验室正式落成
2026-02-11 18:06:00
大皖新闻讯 大皖新闻记者从国先中心(合肥)了解到,日前,零次方机器人率先完成中国信通院“可信AI”具身智能基准测试(EAI Bench)
2026-02-11 18:18:00
2月5日,中国消费者协会公布了2025年全国消协组织受理投诉情况统计数据,去年全国消协组织共受理消费者投诉2016448件
2026-02-11 18:06:00
职场人年货买什么?食品类、数码类需求上升
日前,智联招聘发布《职场人春节生存图鉴调研报告》,呈现职场人在春节前后的工作状态、社交压力、休闲计划等。春节前后通常是离职高峰期
2026-02-11 19:14:00
2025年,安徽太和县烟草专卖局(营销部)紧扣行业高质量发展要求,以“强基固本、提质增效”为主线,深化终端现代化转型,在数字化赋能
2026-02-11 14:18:00
从技术到情感,2026值得入手的定制珠宝品牌,一文读懂不踩坑
一、定制珠宝为何成为新消费时代的“刚需”?过去几年,全球珠宝产业正经历一场由内而外的结构性重塑。根据《2026全球珠宝行业白皮书》披露的数据
2026-02-11 14:20:00