• 我的订阅
  • 科技

清华团队提出新型光计算架构,光训练速度提升1个数量级

类别:科技 发布时间:2024-08-09 09:57:00 来源:DeepTech深科技

近期,清华大学电子工程系方璐教授课题组、自动化系戴琼海教授课题组创新性地设计了全前向智能光计算训练架构,开发出一种名为“太极-II”的通用光训练芯片。

该架构摆脱了对电计算离线训练的依赖,而且能够为智能系统的高效光训练提供支撑。

清华团队提出新型光计算架构,光训练速度提升1个数量级

图丨图中为课题负责人方璐教授,图左和图右分别为论文共同一作薛智威与周天贶(来源:该团队)

研究团队通过建立光子传播对称性模型,未采用传统的电训练反向传播范式,化“反”为“前”。

这种新范式挣脱了前向-反向光场传播严格对齐的束缚,基于通用的光计算原位训练系统,突破了电训练架构对物理光计算的掣肘。

该研究为光计算领域提供了大规模神经网络精准、高效的训练方法,为智能光计算系统的设计及开发提供了新思路,为光的计算能力开拓了新边界。

审稿人对该研究评价称:“本文中提出的想法非常新颖,此类光学神经网络的训练过程是前所未有的。(作者们)所提出的方法不仅有效,而且容易实现。因此,有望成为训练光学神经网络和其他光学计算系统的、广泛采用的工具。”

清华团队提出新型光计算架构,光训练速度提升1个数量级

图丨太极-II 智能光训练概念示意图(来源:该团队)

近日,相关论文以《光神经网络全前向训练》(Fully forward mode training for optical neural networks)为题,发表于 Nature[1]。

清华大学博士生薛智威、博士后周天贶是共同一作,方璐教授、戴琼海教授担任共同通讯作者。清华大学博士生徐智昊、之江实验室虞绍良博士参与了本项研究。

清华团队提出新型光计算架构,光训练速度提升1个数量级

图丨相关论文(来源:Nature)

清华团队提出新型光计算架构,光训练速度提升1个数量级

释放智能光计算的“训练之能”

近年来,随着 ChatGPT、Sora、Llama 等 AI 大模型的快速发展和广泛应用,也对提升算力提出了越来越高的要求。

训练一般的神经网络需要几百到几千万的参数量,而大模型的参数量则多至几十亿级别。

一直以来,电子计算芯片为模型规模的不断发展提供支撑,但不可忽视的问题在于,电子计算架构下的高算力,也意味着高能耗。

以训练 GPT-3 为例,根据美国斯坦福人工智能研究所发布的《‌2023 年人工智能指数报告》‌,训练大模型一次所需的耗电量为 1287 兆瓦。

因此,在现阶段发展 AI 不仅仅需要解决技术问题、算力问题,还意味着面临着能源问题,此前的范式已不能很好地解决当下难题,因此发展新兴智能计算范式应运而生。

光具有干涉、衍射等多维计算模态,以光为计算载体,可以用光的可控传播来构建计算模型。相较于电计算,在完成相同计算的前提下,光计算能够以更快的速度和更低的能耗,来实现相关神经网络。

这意味着,光计算以其算力高和能耗低的优势作为智能计算的“潜力股”,为后摩尔时代带来新的希望。

推理和训练是 AI 大模型核心能力的两个重要阶段,正是看到了这一点,该团队在推理和训练方面进行了同期的并行研究。

今年 4 月,他们在 Science 报道了通用智能光计算芯片“太极”[2],第一次推动光计算从原理验证走向了大规模实验应用。其系统级能效为 160TOPS/W,让人们看到复杂智能任务的推理的更多可能性。

然而,初代“太极”(太极-I)的相关研究以推理为核心,尚未将智能光计算的“训练之能”释放,本次研究中的太极-II 重点则在训练。

清华团队提出新型光计算架构,光训练速度提升1个数量级

摆脱对电计算离线训练的依赖,突破现有支撑训练光网络的规模上限

与模型推理相比,模型训练对算力的需求更为迫切,然而现有光神经网络的训练严重依赖电计算离线建模优化。

电训练架构要求与前向-反向传播模型高度匹配,因此对光计算物理系统的精准对齐提出了更高的要求。其往往会导致梯度计算具有挑战、离线建模慢、映射误差大,极大地限制了光训练的规模和效率。

为解决上述问题,研究人员提出了正反互易和光学共通的解决思路。

·正反互易:全前向智能光计算训练架构。

受物理学对称性的启发,研究人员建立了“空间互易-时间反演”的双对称光传播模型,提出了全前向智能光计算在线训练架构。

薛智威解释说道:“将梯度下降中的反向传播化为光学系统的前向传播,两次前向传播实际上走的是完全相同的路径,因而具备天然对齐的特性,从而保障了物理梯度的计算精度。”

该架构突破了对电计算离线建模训练的依赖,将神经网络训练等效映射为光的前向传播,其高速低功耗特性极大地提升了训练的速度与能效,为支撑大规模网络训练奠定了基础。

·光学共通:通用智能光训练赋能复杂系统。

从波动光学的基本原理出发,该团队提出了多尺度光学系统的通用可微分神经表征,以调制和传播来构建任意光学系统。

研究人员建立了物理光系统的调制-传播与神经网络的激活-连接之间的映射关系,即调制模块的训练可驱动任意网络的权重优化,从而保障了训练的速度与能效。

薛智威表示:“通过这种新型光学系统,我们为复杂物理系统的在线训练提供了‘光速’解决方案。”

清华团队提出新型光计算架构,光训练速度提升1个数量级

图丨全前向智能光计算训练架构(来源:Nature)

系统实测结果表明,太极-II 智能光训练架构在大规模学习、复杂场景智能成像、拓扑光子学等方面都展现了出色的性能。

具体来说:

在大规模学习领域,为“不容易兼得”的计算精度与效率提供解决方案。相较于此前数百万参数的光网络训练速度,太极-II 的光训练速度快 1 个数量级,而代表性智能分类任务的准确率则高出 40%。

在复杂场景智能成像领域,达到千赫兹帧率的智能成像效果,其成像效率提高了 2 个数量级。

在拓扑光子学领域,太极-II 在不基于其他模型先验条件下,能自动搜索非厄米奇异点,让高效、精准解析复杂拓扑系统成为可能。

清华团队提出新型光计算架构,光训练速度提升1个数量级

图丨通用智能光训练赋能复杂系统(来源:Nature)

该研究始于 2021 年年末,最初,他们完成了线性网络,但当推进非线性大规模网络时,遇到了较大挑战。

虽然二者从理论上相对一致,但在实际过程中完成非线性网络并不容易,有时候课题组成员接连好几周都没有任何实验进展。

目前,薛智威在清华大学电子系博士三年级在读,据介绍,这是他博士期间的第一项工作,这项研究花了整整 3 年的时间认真打磨才最终开花结果。

回忆研究的实验过程,薛智威说道:“在北京冬日的一个凌晨,经过了很长时间的优化和调试后,此前一直不能很好工作的系统终于能够工作了,这意味着在实验上已经接近理论。我记得从实验室走出来的时候,感觉风都是甜的。”

清华团队提出新型光计算架构,光训练速度提升1个数量级

有望为后摩尔时代的 AI 大模型提供算力支撑

受物理光学特性启发,太极-II 提出了一种不基于电训练架构的技术路径。

以全前向光学传播模型来求解大规模网络训练难题,克服了计算精度差、训练速度慢、能量效率低的瓶颈,进而支撑多尺度复杂光学系统的高效、高精度在线训练。

据了解,当下研究团队已成功完成原理样片的制备,并向智能光芯片工业化方向推进,正在包括无人机、无人车、机器人等在内的端侧智能系统进行应用部署。

技术从学术界到工业界的转化是一个复杂的过程。尽管太极-II 芯片本身的能耗极低,但片上光源、片上光存储和外围电子设备的工程化进程方面,仍存在相关挑战。

为进一步探索和发展这些技术,研究团队正积极推进与产业界和科研机构的密切合作,以推动光芯片系统的进一步集成优化。

“我们希望在 2-3 年内实现光芯片与外围设备完整封装的产品级光计算系统,逐步实现芯片从专用应用到通用应用的转变。”薛智威表示。

太极-II 的面世,为智能光计算在大规模训练带来新的曙光,它与太极-I 将共同打造光算力新底座,为 AI 大模型训练和推理提供算力发展的新方案。

“太极”不仅是智能光计算系列芯片,更是光计算系统特有对偶属性的辩证协作架构。太极 I 和 II 正如其命名一样,既是分立的两个部分,又组合成一个统一的整体。

该团队通过太极-I 和太极-II 的相关研究,完成了对 AI 推理和训练的探索,它们又共同构成了大规模智能计算的整个生命周期,开启了智能光计算的新时代。

本次研究的完成,让人们看到了包括太极系列光芯片在内的智能光算力船帆的不懈航行,智能光计算平台终以解决 AI 算力所面临的问题为目标,将驶向 AI 算力的星辰大海,为绿色环保和高效率的 AI 大模型、通用人工智能等提供一种全新方案。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-08-09 12:45:01

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

中国科大实现超导体系 “量子计算优越性”新纪录
...机线路采样问题的速度比目前最快的超级计算机快15个数量级,超过谷歌2024年10月公开发表的最新成果6个数量级。这一成果是我国继超导量子计算原型机“祖冲之二号”实现超导量子计
2025-03-03 23:23:00
用最古朴思路“苦熬”光芯片
...每焦耳160万亿次运算,超越主流商用人工智能芯片3个数量级,为后摩尔时代高性能智能计算开辟了新路径。“太极”芯片首次赋能智能光计算,实现超过1000个类别的自然场景图像分类以
2024-05-28 23:16:00
清华大学获芯片领域重要突破!
...据介绍,太极光芯片的计算能效超现有智能芯片2—3个数量级,将可为百亿像素大场景光速智能分析、百亿参数大模型训练推理、毫瓦级低功耗自主智能无人系统提供算力支撑。文中图片均由受访
2024-04-12 10:19:00
光电融合新突破!清华大学建立光电智能计算架构—ACCEL芯片
...仅采用180nmCMOS工艺,已取得比7nm制程的高性能芯片多个数量级的性能提升。同时所使用的材料简单易得,造价仅为后者的几十分之一。图片来源:视频截图近年来,如何构建新的计
2023-11-05 13:34:00
百纳米完胜7纳米?清华团队提出全新芯片架构,成果已在《自然》杂志发表
...用180nm CMOS工艺,已取得比7纳米制程的高性能芯片多个数量级的性能提升。与此同时,其所使用的材料简单易得,造价仅为后者的几十分之一
2023-10-31 21:02:00
国内首款3D科学计算机!静安科技企业思朗科技发布“天穹”
...算机“天穹”,其相较传统二维架构超算系统快2—4个数量级,将为中国在全球人工智能与科学融合的新赛道中注入创新动能。当前,全球人工智能竞争进入新阶段,在《关于深入实施“人工智能
2026-01-15 17:08:00
超高速光电计算芯片“挣脱”摩尔定律
...0纳米CMOS工艺,比7纳米制程的高性能芯片性能提升多个数量级。与此同时,光电融合芯片所使用的材料简单易得,造价仅为高性能芯片的几十分之一。戴琼海表示,开发人工智能时代的全新
2023-11-02 07:05:00
清华大学开发超高速光电计算芯片,算力超 3000 倍
...用180nmCMOS工艺,已取得比7纳米制程的高性能芯片多个数量级的性能提升。与此同时,其所使用的材料简单易得,造价仅为后者的几十分之一。清华大学戴琼海院士、方璐副教授、乔飞
2023-10-30 22:09:00
科学家研发储备池计算机,无需任何光电,对应算力高达101TOPS
...品,在同等功耗之下,储备池光计算机的算力高出 1 个数量级,时延则能降低 3 到 4 个数量级。提出真问题,解决真矛盾对于人工智能来说,人们更多震撼于它的功能之强大。但是,它
2024-01-25 10:19:00
更多关于科技的资讯:
新春佳节,浙江不少企业春节“不打烊”,抢订单、赶交付、跑海外,把年过在了车间里和海外展台前。走进宁波这家科技企业,工作人员正紧盯屏幕
2026-02-20 15:04:00
马年春节,杭城消费市场持续升温。一批全国首店、浙江首店、杭州首店密集登陆湖滨、武林、钱江新城、奥体等核心商圈,覆盖潮玩
2026-02-20 07:31:00
大年初三,杭州苏宁易购庆春路店暖意融融。大厅里“焕新幸福年”的红色标语格外醒目。店内客流平稳,多为全家同行的家庭顾客,虽不似年前拥挤
2026-02-20 08:01:00
“库迪咖啡竟然涨价了,9.9元的咖啡以后还能闭眼冲吗?”春节前最后一个工作日,东北姑娘小乔中午赶到杭州火车东站,准备坐高铁回老家
2026-02-20 08:01:00
潮声丨从“Made in”到“Design by”,浙江品牌出海记
新春,义乌老板们已经忙碌起来。这几天,24家义乌企业亮相2026年美国拉斯维加斯服装服饰及面料展,带着新品抢订单、拓市场
2026-02-19 16:24:00
新春走基层|“解码”潮玩盲盒:Z世代用情绪消费点亮团圆年
中青报·中青网记者沈杰群余冰玥李怡蒙见习记者蒋欣雨95后北京职员王之怡在新加坡休假时,特意去了环球影城附近的泡泡玛特,店内挤满了年轻人
2026-02-19 12:05:00
大年初一,匆匆赶到湖州的生产基地,给春节坚持留守在生产一线的一百多名员工发完新春红包后,金羽新能董事长兼总经理黄杜斌又拿起了手机
2026-02-19 08:20:00
以下为报道原文:从“猜你喜欢”到“懂你需要” 人工智能加速“嵌入”日常生活人民日报 记者 谷业凯“帮我订春节假期南京到三亚的往返机票
2026-02-18 17:52:00
重要突破!中国科大发现新型有序物态——理想非晶体
大皖新闻讯 2月18日,大皖新闻记者从中国科学技术大学获悉,该校童华教授、徐宁教授及其合作者在非晶物态理论研究中取得重要突破
2026-02-18 17:53:00
新岁启程,马蹄声疾。骉(biāo),《说文解字》解读为“众马也”。单从字形便觉气势如虹,三马叠加,并辔而行。从一马当先
2026-02-18 14:39:00
以“兴趣”为引,开启银龄健康生活新方式:简橙太极如何助力科学养生、乐享晚年
在当今社会,随着健康老龄化的理念日益深入人心,越来越多的中老年人开始积极追求丰富多彩的退休生活和身心和谐的健康状态。这一趋势催生了对优质
2026-02-18 12:53:00
【网络中国节·春节】AI机器人带来新春消费新体验 带旺厦门文旅市场
AI机器人带来新春消费新体验厦门通过AI赋能打造新业态新场景,带旺假期文旅消费市场市民游客观看机器人咖啡师制作咖啡。(夏商咖啡供图)厦门网讯(厦门日报记者 沈彦彦 王元晖)厦门中山路“两岸数智非遗年”现场
2026-02-18 09:55:00
全力保交付 海辰储能厦门基地春节期间维持满负荷生产
位于同翔高新城的海辰储能厦门基地春节期间——满负荷生产 全力保交付春节期间,海辰储能满负荷生产。(厦门日报记者 卢剑豪 摄)厦门网讯(厦门日报记者 林露虹)大年初一
2026-02-18 10:26:00
成功捕获到约6500光年外的宇宙线信号网通院参研的LACT首台望远镜完成“首光”河北新闻网讯(河北日报记者王璐丹)近日
2026-02-18 07:58:00