我的订阅
科技

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

如何让等变神经网络可解释性更强？试试将它分解成「简单表示」

类别：科技发布时间：2024-08-24 09:31:00 来源：机器之心Pro

神经网络是一种灵活且强大的函数近似方法。而许多应用都需要学习一个相对于某种对称性不变或等变的函数。图像识别便是一个典型示例 —— 当图像发生平移时，情况不会发生变化。等变神经网络（equivariant neural network）可为学习这些不变或等变函数提供一个灵活的框架。

而要研究等变神经网络，可使用表示论（representation theory）这种数学工具。（请注意，「表示」这一数学概念不同于机器学习领域中的「表征」的典型含义。本论文仅使用该术语的数学意义。）

近日，Joel Gibson、Daniel Tubbenhauer 和 Geordie Williamson 三位研究者对等变神经网络进行了探索，并研究了分段线性表示论在其中的作用。

论文标题：Equivariant neural networks and piecewise linear representation theory 论文地址：https://arxiv.org/pdf/2408.00949

在表示论中，简单表示（simple representation）是指该理论的不可约简的原子。在解决问题时，表示论的一个主要策略是将该问题分解成简单表示，然后分别基于这些基本片段研究该问题。但对等变神经网络而言，这一策略并不奏效：它们的非线性性质允许简单表示之间发生互动，而线性世界无法做到这一点。

但是，该团队又论证表明：将等变神经网络的层分解成简单表示依然能带来好处。然后很自然地，他们又进一步研究了简单表示之间的分段线性映射和分段线性表示论。具体来说，这种分解成简单表示的过程能为神经网络的层构建一个新的基础，这是对傅立叶变换的泛化。

该团队表示：「我们希望这种新基础能为理解和解读等变神经网络提供一个有用的工具。」

该论文证明了什么？

在介绍该论文的主要结果之前，我们先来看一个简单却非平凡的示例。

以一个小型的简单神经网络为例：

其中每个节点都是 ℝ 的一个副本，每个箭头都标记了一个权重 w，并且层之间的每个线性映射的结果都由一个非线性激活函数组成，然后再进入下一层。

为了构建等变神经网络，可将 ℝ 和 w 替换成具有更多对称性的更复杂对象。比如可以这样替换：

其可被描述为：

不过，要想在计算机上真正实现这个结构，却根本不可能，但这里先忽略这一点。

现在暂时假设函数是周期性的，周期为 2π。当用傅里叶级数展开神经网络时，我们很自然就会问发生了什么。在傅里叶理论中，卷积算子会在傅里叶基中变成对角。因此，为了理解信号流过上述神经网络的方式，还需要理解激活函数在基频上的工作方式。

一个基本却关键的观察是：(sin (x)) 的傅里叶级数仅涉及较高共振频率的项：

（这里展示了当是 ReLU 时，(sin (x)) 的前几个傅里叶级数项。）这与我们拨动吉他琴弦时发生的情况非常相似：一个音符具有与所弹奏音符相对应的基频，以及更高的频率（泛音，类似于上面底部的三张图片），它们结合在一起形成了吉他独特的音色。

该团队的研究表明：一般情况下，在等变神经网络中，信息会从更低共振频率流向更高共振频率，但反之则不然：

这对等变神经网络有两个具体影响：

等变神经网络的大部分复杂性都出现在高频区，如果想学习一个低频函数，那么可以忽略神经网络中与高频相对应的大部分。

举个例子，如果使用典型的流式示意图（称为交互图 /interaction graph）表示，一个基于（8 阶循环群）构建的等变神经网络是这样的：

其中的节点是 C_8 的简单表示，节点中的值表示生成器的动作。在此图中，「低频」简单表示位于顶部，信息从低频流向高频。这意味着在大型网络中，高频将占据主导地位。

主要贡献

该团队做出了一些重要的理论贡献，主要包括：

他们指出将等变神经网络分解成简单表示是有意义且有用的。他们论证表明等变神经网络必须通过置换表示构建。他们证明分段线性（但并非线性）的等变映射的存在受控于类似于伽罗瓦理论的正规子群。他们计算了一些示例，展示了理论的丰富性，即使在循环群等「简单」示例中也是如此。

等变神经网络和分段线性表示

该团队在论文中首先简要介绍了表示论和神经网络的基础知识，这里受限于篇幅，我们略过不表，详见原论文。我们仅重点介绍有关等变神经网络和分段线性表示的研究成果。

等变神经网络：一个示例

这篇论文的出发点是：学习关于某种对称性的等变映射是有用的。举些例子：

图像识别结果通常不会随平移变化，比如识别图像中的「冰淇淋」时与冰淇淋所在的位置无关；文本转语音时，「冰淇淋」这个词不管在文本中的什么位置，都应该生成一样的音频；工程学和应用数学领域的许多问题都需要分析点云。这里，人们感兴趣的通常是对点云集合的质量评估，而与顺序无关。换句话说，这样的问题不会随点的排列顺序变化而变化。因此，这里的学习问题在对称群下是不变的。

为了解释构建等变神经网络的方式，该团队使用了一个基于卷积神经网络的简单示例，其要处理一张带周期性的图像。

这里，这张周期性图像可表示成一个 n × n 的网格，其中每个点都是一个实数。如果设定 n=10，再将这些实数表示成灰度值，则可得到如下所示的图像：

我们可以在这张图上下左右进行重复，使之具有周期性，也就相当于这张图在一个环面上。令 C_n = ℤ/nℤ 为 n 阶循环群，C^2_n = C_n × C_n。用数学术语来说，一张周期性图像是从群 C^2_n 到 ℝ 的映射的 ℝ 向量空间的一个元素：。在这个周期性图像的模型中，V 是一个「C^2_n 表示」。事实上，给定 (a, b) ∈ C^2_n 和 ∈ V，可通过移动坐标得到一张新的周期性图像：

((a, b)・f)(x, y) = f (x + a, y + b)

也就是说，平移周期性图像会得到新的周期性图像，例如：

得到等变神经网络的一个关键观察是：从 V 到 V 的所有线性映射的 ℝ 向量空间的维度为 n^4，而所有 C^2_n 表示线性映射的 ℝ 向量空间的维度为 n^2。

下面来看一个 C^2_n 等变映射。对于，可通过一个卷积型公式得到 C^2_n 等变映射 V → V：

举个例子，如果令 c = 1/4 ((1, 0) + (0, 1) + (−1, 0) + (0, −1))。则 c・是周期性图像且其像素 (a, b) 处的值是其相邻像素 (a+1, b)、(a, b+1)、(a−1, b) 和 (a, b−1) 的值的平均值。用图像表示即为：

更一般地，不同 c 的卷积可对应图像处理中广泛使用的各种映射。

现在，就可以定义这种情况下的 C^2_n 等变神经网络了。其结构如下：

其中每个箭头都是一个卷积。此外，W 通常是 ℝ 或 V。上图是一张卷积神经网络的（经过简化的）图像，而该网络在机器学习领域具有重要地位。对于该网络的构建方式，值得注意的主要概念是：

此神经网络的结构会迫使得到的映射 V → W 为等变映射。所有权重的空间比传统的（全连接）神经网络小得多。在实践中，这意味着等变神经网络所能处理的样本比「原始」神经网络所能处理的大得多。（这一现象也被机器学习研究者称为权重共享。）

该团队还指出上图隐式地包含了激活图，而他们最喜欢的选择是 ReLU。这意味着神经网络的组成成分实际上是分段线性映射。因此，为了将上述的第二个主要观察（通过将问题分解成简单表示来简化问题）用于等变神经网络，很自然就需要研究分段线性表示论。

等变神经网络

下面将给出等变神经网络的定义。该定义基于前述示例。

令 G 为一个有限群。Fun (X, ℝ) 是有限群 G 的置换表示（permutation representation）。

定义：等变神经网络是一种神经网络，其每一层都是置换表示的直接和，且所有线性映射都是 G 等变映射。如图所示：

（这里，绿色、蓝色和红色点分别表示输入、隐藏层和输出层，perm 表示一个置换表示，它们并不一定相等。和普通的原始神经网络一样，这里也假设始终会有一个固定的激活函数，其会在每个隐藏层中被逐个应用到分量上。）

最后举个例子，这是一个基于点云的等变神经网络，而点云是指 ℝ^d 中 n 个不可区分的点构成的集合。这里 n 和 d 为自然数。在这种情况下，有限群 G 便为 S_n，即在 n 个字母上的对称群，并且其输入层由 (ℝ^d)^n = (ℝ^n)^d 给定，而我们可以将其看作是 d 个置换模块 Fun ({1, ..., n}, ℝ) 的副本。如果将 Fun ({1, ..., n}, ℝ) 写成 n，则可将典型的等变神经网络表示成：

（这里 d=3 且有 2 层隐藏层。）这里的线性映射应当是 S_n 等变映射，而我们可以基于下述引理很快确定出可能的映射。

引理：对于有限 G 集合 X 和 Y，有，其中 Fun_G (X × Y, ℝ) 表示 G 不变函数 X×Y →ℝ。

根据该引理，，并且 G = S_n 有两条由对角及其补集（complement）给出的轨道。因此，存在一个二维的等变映射空间 n→n，并且这与 n 无关。（在机器学习领域，这种形式的 S_n 的等变神经网络也被称为深度网络。）

为了更详细地理解等变神经网络以及相关的分段线性表示论的定义、证明和分析，请参阅原论文。

以上内容为资讯信息快照，由td.fyun.cc爬虫进行采集并收录，本站未对信息做任何修改，信息内容不代表本站立场。

快照生成时间：2024-08-24 11:45:03

本站信息快照查询为非营利公共服务，如有侵权请联系我们进行删除。

信息原文地址：

更多关于解释性,神经网络,神经,解释,网络,神经网络的资讯：

用gpt-4解释30万神经元，原来ai的黑盒要ai自己去打开

...数据特征。但对于规模已经达到百亿、千亿级别的大规模神经网络来说，工作量和工作难度就都涨了亿点点吧。由此，OpenAI的研究人员想到，干嘛不让AI去自动化搞定这个大工程？在这项

2023-05-11 20:04:00

图神经网络在复杂网络异常检测中的应用

...难以应对节点间关系复杂、数据异质性高的检测任务。图神经网络（GNN）作为一种融合结构与属性信息的深度学习模型，具备强大的图表示学习能力，为异常识别提供了有效路径。本文系统梳理

2025-12-26 23:53:00

科学家竞相破解大型语言模型背后的谜团

...器学习算法，而先进的机器学习算法使用模拟人脑结构的神经网络，信息在不同神经元间传递，以人类不易理解的方式内化数据，缺乏可视化和透明度。这个问题对ChatGPT等大型语言模型（

2024-05-18 02:42:00

人工智能研究新进展中国团队提出“基于内生复杂性”类脑计算方

...基于“尺度定律”(Scaling Law)去构建更大、更深和更宽的神经网络，可称之为“基于外生复杂性”的通用智能实现方法，但这一路径面临着计算资源及能源消耗难以为继、可解释性

2024-08-17 12:25:00

稀疏自编码器是如何工作的，这里有一份直观说明

...客文章，直观地解释了 SAE 的工作方式。可解释性的难题神经网络最自然的组件是各个神经元。不幸的是，单个神经元并不能便捷地与单个概念相对应，比如学术引用、英语对话、HTTP

2024-08-06 09:27:00

爆火神经网络架构KAN更新2.0！可专属定制，轻松应对经典物

爆火神经网络架构KAN，上新了！KAN2.0。此次与科学问题更深入地融合，可以轻松解出经典物理学研究。比如发现拉格朗日量（用来描述整个物理系统动力状态的函数）除此之外，研究者还可

2024-08-22 09:52:00

新一代芯片电路逻辑综合，可扩展可解释的神经电路生成框架

...过程有机结合，展现了新一代逻辑综合技术的美好前景。神经网络架构搜索（Differential Neural Network Architecture Search

2024-11-06 09:44:00

深度学习在AI教育中的应用及其关键技术探究

摘要：本文介绍了深度学习技术的基本原理，包括神经网络结构和工作原理、激活函数的选择和作用、损失函数的定义和优化方法以及反向传播算法的实现细节。然后，以智能教育辅助系统为例，说明了

2023-09-12 11:30:00

揭开黑盒子：探索人工智能背后的科学原理与风险

...是机器是如何表现智能特征的（symptoms of intelligence）。在神经网络时代到来之前，人工智能领域占主导地位的是依靠暴力算法的专家系统

2023-06-05 14:00:00

更多关于科技的资讯：

福建龙岩供电公司开展智能机器人配网带电作业

东南网龙岩1月4日讯（通讯员詹春艳林培民）近日，龙岩市新罗区10千伏中新线上空，一场静默而精准的“人机协同”带电作业悄然完成

2026-01-04 23:27:00

蔡高民：颠覆认知！打破西方理论垄断！中国老年学自主知识体系诞

《全生命周期养能力发展与医养结合：理论和实践》的核心突破，在于建构“养”的元概念、定义与内涵外延，并以此为基础构建了逻辑自洽的三大理论体系

2026-01-04 20:15:00

学者预见2026丨罗军：低空经济将从基础设施开始全面推进

编者按：周期更迭，变量叠加。站在“十五五”开局之年的关键节点上，各行业如何调整节奏、校准路径、寻找增量？中新经纬广邀多领域学者

2026-01-04 20:21:00

贵阳“呼噜”IP市集引领过年新体验

春节临近，年味渐浓。在贵阳，一场不同于传统年货市集的新春活动正在酝酿——它以“创意游乐场”为定位，融合在地风物、潮流文化与青年创造力

2026-01-04 21:50:00

广告不乱“跳” 消费更舒心

不经意晃动手机，软件立即跳转购物页面。最近，记者实测发现，备受诟病的“摇一摇跳转”广告乱象依然时有发生，困扰着不少用户

2026-01-04 17:59:00

2025年度帆书APP经典热搜榜，精准解锁经典中的成长指南

当“信息过载”成为常态，“选择困难”深入骨髓，我们比任何时候都更需要一个清晰的信号：什么才是值得投入时间的真知？近日，帆书APP根据全年用户收听数据发布的“经典热搜榜”

2026-01-04 14:25:00

告别“准社交”让真实互动回归生活

黄鹤权据光明网报道，英国《剑桥词典》将2025年年度词汇定为“准社交”，形容个体单方面与名人、虚拟角色或聊天机器人产生的密切连接感

2026-01-04 14:25:00

飞晟科技入选海南省儋州市中小企业数字化转型城市试点服务商

近日，海南省儋州市科学技术和工业信息化局对外公示《儋州市中小企业数字化转型城市试点服务商拟纳入名单（第一批）》。公示名单显示

2026-01-04 15:28:00

抖音生活服务联合南京德基广场落地“心动街区”，电视台直播+明

12月30日，抖音生活服务“心动街区”活动联合江苏电视台城市频道零距离栏目发起“心动德基24h·南京跨年在德基”美食专场直播

2026-01-04 15:30:00

浪潮卓数大数据旗下公司入围多项2025年山东省大数据产业“三

近日，山东省工业和信息化厅正式公布2025年山东省大数据产业“三优两重”项目名单。浪潮卓数大数据旗下天元征信公司、浪潮（山东）大数据科技有限公司

2026-01-04 15:31:00

华麟数科推出联盟生态链“麒麟链”，加速数字经济深度融合与转型

【中国，2026年1月】 —— 在数字经济浪潮席卷全球、深入渗透各行各业的关键阶段，华麟数科（广东）有限公司（以下简称“华麟数科”）正式宣布

2026-01-04 15:31:00

以具身智能赋能教育未来----开普勒机器人助力高校产学研融合

在新一轮科技革命与产业变革加速演进的背景下，人工智能正从"算法与算力"的竞争，走向"智能体与真实世界深度融合"的新阶段

2026-01-04 15:33:00

中国首个！新奈发布“智能呼吸工程体系”，破解家用呼吸设备长期

在睡眠与呼吸健康领域，真正的改变往往不是某一功能的增加，而是背后那套长期支撑它持续进化的技术体系。2025年12月，新奈 Synaire 对外发布年度科研成果

2026-01-04 15:33:00

中国科技定义未来运动 HURA超现实远程赛车亮相世界未来运动

2025年12月18日至23日，全球体育科技前沿的目光齐聚阿联酋首都阿布扎比国家展览中心。在这里举办的2025世界未来运动会（Games of the Future 2025）上

2026-01-04 15:33:00

京东健康深化政企协同助力吉林人参产业发展提质增效

元旦假期期间，人参等滋补品在节庆送礼与家庭健康消费中的需求集中释放。京东健康的消费数据显示，近一个月以来，人参等滋补品类销售同比增长55%

2026-01-04 15:59:00

头条订阅服务

如何让等变神经网络可解释性更强？试试将它分解成「简单表示」