• 我的订阅
  • 科技

爆火神经网络架构KAN更新2.0!可专属定制,轻松应对经典物理学

类别:科技 发布时间:2024-08-22 09:52:00 来源:量子位

爆火神经网络架构KAN,上新了!

KAN2.0。

此次与科学问题更深入地融合,可以轻松解出经典物理学研究。

比如发现拉格朗日量(用来描述整个物理系统动力状态的函数)

爆火神经网络架构KAN更新2.0!可专属定制,轻松应对经典物理学

除此之外,研究者还可以量身定制属于自己的KAN2.0,将专业知识作为辅助变量添加到输入当中去。

此前,KAN横空出世,一夜引爆科技圈。它以200万参数模型架构,直接复现DeepMind用30万参数的MLPs发现数学定理的研究。要知道,后者可是登上Nature封面的研究。

由于KAN性能太好,一度引来关于「能否替代掉Transformer的MLP层」的探讨,大家直呼:Yes We KAN!

MIT博士生刘子鸣再次为论文一作。

爆火神经网络架构KAN更新2.0!可专属定制,轻松应对经典物理学

业内学者们,纷纷赶来祝贺。

爆火神经网络架构KAN更新2.0!可专属定制,轻松应对经典物理学

爆火神经网络架构KAN更新2.0!可专属定制,轻松应对经典物理学

KAN2.0将AI与科学统一起来

AI+科学的一大挑战在于他们之间固有的不兼容性:当前AI主要基于连接主义,科学则依赖于符号主义。

此次新框架KAN2.0就主打将KANs同科学无缝协同,这种协同作用是双向的:科学到 KAN(将科学知识融入 KAN),KAN到科学(从KAN中提取科学见解)。

爆火神经网络架构KAN更新2.0!可专属定制,轻松应对经典物理学

更具体来说,KAN2.0对科学发现主要有三个方面的作用,从简单粗略到逐渐精细复杂:

识别重要特征、揭示模块结构、发现符号公式。

在原始KAN基础上主要引入了这三个新功能。

1、MultKAN:带有乘法节点的 KAN。

爆火神经网络架构KAN更新2.0!可专属定制,轻松应对经典物理学

2、kanpiler:将符号公式编译成 KAN的编译器。

爆火神经网络架构KAN更新2.0!可专属定制,轻松应对经典物理学

3、树转化器,将 KAN2.0架构(或任何神经网络)转换为树状图。

爆火神经网络架构KAN更新2.0!可专属定制,轻松应对经典物理学

跟上一版本相比,KAN2.0的解释性更通用,比如像化学、生物学等这种很难用符号方程表示的,模块化结构和关键特征能够来描述。

比如,用户可以将模块化结构构建到KAN2.0中。

爆火神经网络架构KAN更新2.0!可专属定制,轻松应对经典物理学

再通过KAN2.0同MLP神经元交换,就可以直接看到模块化结构。

爆火神经网络架构KAN更新2.0!可专属定制,轻松应对经典物理学

此外,团队探究了如何将先验知识融入KAN2.0。

爆火神经网络架构KAN更新2.0!可专属定制,轻松应对经典物理学

基于这些更新,团队展示了KAN2.0发现各种经典物理定律的能力。

比如发现二维谐振子的守恒量。

爆火神经网络架构KAN更新2.0!可专属定制,轻松应对经典物理学

利用MLP和KAN2.0重新发现史瓦西黑洞的隐藏对称性。

爆火神经网络架构KAN更新2.0!可专属定制,轻松应对经典物理学

还有像通过与KAN2.0交互,发现构造定律。

爆火神经网络架构KAN更新2.0!可专属定制,轻松应对经典物理学

接下来,团队有两个方向:一是将该框架应用于更大规模的问题;二是将其扩展到物理学以外的其他科学学科。

MIT华人一作

此次研究来自MIT、加州理工学院、MIT CSAIL等机构的五位研究者,共有三位华人。

爆火神经网络架构KAN更新2.0!可专属定制,轻松应对经典物理学

相比于KAN初始版本,还有不少原班人马,其中MIT刘子鸣依然为一作。

爆火神经网络架构KAN更新2.0!可专属定制,轻松应对经典物理学

刘子鸣目前是MIT四年级博士生,Max Tegmark是他的导师,其研究兴趣在于人工智能与物理学的交叉领域,具体像AI科学家、物理学启发的深度学习、深度学习科学、机械可解释性等。

爆火神经网络架构KAN更新2.0!可专属定制,轻松应对经典物理学

由于KAN受到广泛的关注,作为核心作者,他在GitHub页面上特意注明,在设计KAN并编写代码的时候,考虑的是数学和物理示例(规模相当小!)因此没有考虑到效率而可重用性方面的优化。

对于专注机器学习的用户,他坦言,KAN可能还不是个可以开箱即用的简单插件(目前还不是)。

KAN和MLP不能互相取代,他们在某些情况下各有优势,在其他情况下也有局限性。

爆火神经网络架构KAN更新2.0!可专属定制,轻松应对经典物理学

好了,感兴趣的小伙伴,可戳下方链接了解更多~

论文链接:https://arxiv.org/abs/2408.10205参考链接:[1]https://github.com/KindXiaoming/pykan?tab=readme-ov-file[2]https://kindxiaoming.github.io/[3]https://x.com/ZimingLiu11/status/1825731703723405757

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-08-22 11:45:08

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

对复杂光束进行分类:新的超表面设计推动了光学物理学的发展
多层自旋多路复用超表面在多路复用衍射神经网络(MDNN)中充当神经元,用于检测和分类矢量结构光束。图片来源:X. Li et al
2024-06-15 09:30:00
DeepMind最新成果剑指量子力学,FermiNet或将破解近百年计算难题
...新智元导读】DeepMind联合帝国理工学院的学者,专注于用神经网络方法对量子力学中经典的薛定谔方程进行近似求解。继2020年提出FermiNet后
2024-09-05 09:51:00
诺贝尔奖得主的奇说:揭秘死后灵魂以“量子形态”存在的科学解释
...贝尔奖得主的观点:量子意识与灵魂存续之间的联系量子物理学作为一门前沿科学,对人类认知世界的方式产生了深远的影响。最近,一位著名的诺贝尔奖得主提出了一个引人注目的观点:量子意识
2024-01-19 11:21:00
国泰君安证券:具身智能,人工智能的下一个浪潮
...并催动了联接主义的发展,形成了包括多层感知机、前向神经网络、循环神经网络,直至今日风靡学术界与产业界的深度神经网络等多种方法。这种用人工神经网络模拟认知过程的方法在适应、泛化
2023-06-30 10:01:00
人类生活在巨型生物体内?宇宙和大脑结构相似?用光速来否定推测
...点点,它们通过无数精细的连接,构成了一个无比复杂的神经网络。这个网络不仅承载着我们的感知、思考、记忆等高级功能,还让我们能够理解和适应这个复杂多变的世界。神经元,作为大脑神经
2024-06-20 10:35:00
...它像一个串行的计算,而量子擅长的是并行的事情,它对神经网络可能可以做一些优化,但是在这种大语言模型上可能不一定擅长,至少从我个人来看,现在还没有找到很好的点去将二者结合。”此
2024-07-11 11:16:00
...究将NP-complete组合优化问题转化为序列决策问题,利用图神经网络模型,捕捉伊辛模型的晶格特征和节点间的长程相互关联。在不依赖人类专家经验的前提下,只通过数据驱动的方式
2023-02-21 02:16:00
量旋科技项金根:IBM攻克“不可靠”难题,为量子计算迈向实用阶段奠定基础
...非CPU芯片,因为GPU具备并行计算单元,处理深度学习以及神经网络模型更快,以后量子芯片也会在这方面扮演重要的角色。返回搜狐,查看更多责任编辑:
2023-06-25 22:00:00
清华团队提出新型光计算架构,光训练速度提升1个数量级
...对物理光计算的掣肘。该研究为光计算领域提供了大规模神经网络精准、高效的训练方法,为智能光计算系统的设计及开发提供了新思路,为光的计算能力开拓了新边界。审稿人对该研究评价称:“
2024-08-09 09:57:00
更多关于科技的资讯: