• 我的订阅
  • 科技

清华团队提出新型光计算架构,光训练速度提升1个数量级

类别:科技 发布时间:2024-08-09 09:57:00 来源:DeepTech深科技

近期,清华大学电子工程系方璐教授课题组、自动化系戴琼海教授课题组创新性地设计了全前向智能光计算训练架构,开发出一种名为“太极-II”的通用光训练芯片。

该架构摆脱了对电计算离线训练的依赖,而且能够为智能系统的高效光训练提供支撑。

清华团队提出新型光计算架构,光训练速度提升1个数量级

图丨图中为课题负责人方璐教授,图左和图右分别为论文共同一作薛智威与周天贶(来源:该团队)

研究团队通过建立光子传播对称性模型,未采用传统的电训练反向传播范式,化“反”为“前”。

这种新范式挣脱了前向-反向光场传播严格对齐的束缚,基于通用的光计算原位训练系统,突破了电训练架构对物理光计算的掣肘。

该研究为光计算领域提供了大规模神经网络精准、高效的训练方法,为智能光计算系统的设计及开发提供了新思路,为光的计算能力开拓了新边界。

审稿人对该研究评价称:“本文中提出的想法非常新颖,此类光学神经网络的训练过程是前所未有的。(作者们)所提出的方法不仅有效,而且容易实现。因此,有望成为训练光学神经网络和其他光学计算系统的、广泛采用的工具。”

清华团队提出新型光计算架构,光训练速度提升1个数量级

图丨太极-II 智能光训练概念示意图(来源:该团队)

近日,相关论文以《光神经网络全前向训练》(Fully forward mode training for optical neural networks)为题,发表于 Nature[1]。

清华大学博士生薛智威、博士后周天贶是共同一作,方璐教授、戴琼海教授担任共同通讯作者。清华大学博士生徐智昊、之江实验室虞绍良博士参与了本项研究。

清华团队提出新型光计算架构,光训练速度提升1个数量级

图丨相关论文(来源:Nature)

清华团队提出新型光计算架构,光训练速度提升1个数量级

释放智能光计算的“训练之能”

近年来,随着 ChatGPT、Sora、Llama 等 AI 大模型的快速发展和广泛应用,也对提升算力提出了越来越高的要求。

训练一般的神经网络需要几百到几千万的参数量,而大模型的参数量则多至几十亿级别。

一直以来,电子计算芯片为模型规模的不断发展提供支撑,但不可忽视的问题在于,电子计算架构下的高算力,也意味着高能耗。

以训练 GPT-3 为例,根据美国斯坦福人工智能研究所发布的《‌2023 年人工智能指数报告》‌,训练大模型一次所需的耗电量为 1287 兆瓦。

因此,在现阶段发展 AI 不仅仅需要解决技术问题、算力问题,还意味着面临着能源问题,此前的范式已不能很好地解决当下难题,因此发展新兴智能计算范式应运而生。

光具有干涉、衍射等多维计算模态,以光为计算载体,可以用光的可控传播来构建计算模型。相较于电计算,在完成相同计算的前提下,光计算能够以更快的速度和更低的能耗,来实现相关神经网络。

这意味着,光计算以其算力高和能耗低的优势作为智能计算的“潜力股”,为后摩尔时代带来新的希望。

推理和训练是 AI 大模型核心能力的两个重要阶段,正是看到了这一点,该团队在推理和训练方面进行了同期的并行研究。

今年 4 月,他们在 Science 报道了通用智能光计算芯片“太极”[2],第一次推动光计算从原理验证走向了大规模实验应用。其系统级能效为 160TOPS/W,让人们看到复杂智能任务的推理的更多可能性。

然而,初代“太极”(太极-I)的相关研究以推理为核心,尚未将智能光计算的“训练之能”释放,本次研究中的太极-II 重点则在训练。

清华团队提出新型光计算架构,光训练速度提升1个数量级

摆脱对电计算离线训练的依赖,突破现有支撑训练光网络的规模上限

与模型推理相比,模型训练对算力的需求更为迫切,然而现有光神经网络的训练严重依赖电计算离线建模优化。

电训练架构要求与前向-反向传播模型高度匹配,因此对光计算物理系统的精准对齐提出了更高的要求。其往往会导致梯度计算具有挑战、离线建模慢、映射误差大,极大地限制了光训练的规模和效率。

为解决上述问题,研究人员提出了正反互易和光学共通的解决思路。

·正反互易:全前向智能光计算训练架构。

受物理学对称性的启发,研究人员建立了“空间互易-时间反演”的双对称光传播模型,提出了全前向智能光计算在线训练架构。

薛智威解释说道:“将梯度下降中的反向传播化为光学系统的前向传播,两次前向传播实际上走的是完全相同的路径,因而具备天然对齐的特性,从而保障了物理梯度的计算精度。”

该架构突破了对电计算离线建模训练的依赖,将神经网络训练等效映射为光的前向传播,其高速低功耗特性极大地提升了训练的速度与能效,为支撑大规模网络训练奠定了基础。

·光学共通:通用智能光训练赋能复杂系统。

从波动光学的基本原理出发,该团队提出了多尺度光学系统的通用可微分神经表征,以调制和传播来构建任意光学系统。

研究人员建立了物理光系统的调制-传播与神经网络的激活-连接之间的映射关系,即调制模块的训练可驱动任意网络的权重优化,从而保障了训练的速度与能效。

薛智威表示:“通过这种新型光学系统,我们为复杂物理系统的在线训练提供了‘光速’解决方案。”

清华团队提出新型光计算架构,光训练速度提升1个数量级

图丨全前向智能光计算训练架构(来源:Nature)

系统实测结果表明,太极-II 智能光训练架构在大规模学习、复杂场景智能成像、拓扑光子学等方面都展现了出色的性能。

具体来说:

在大规模学习领域,为“不容易兼得”的计算精度与效率提供解决方案。相较于此前数百万参数的光网络训练速度,太极-II 的光训练速度快 1 个数量级,而代表性智能分类任务的准确率则高出 40%。

在复杂场景智能成像领域,达到千赫兹帧率的智能成像效果,其成像效率提高了 2 个数量级。

在拓扑光子学领域,太极-II 在不基于其他模型先验条件下,能自动搜索非厄米奇异点,让高效、精准解析复杂拓扑系统成为可能。

清华团队提出新型光计算架构,光训练速度提升1个数量级

图丨通用智能光训练赋能复杂系统(来源:Nature)

该研究始于 2021 年年末,最初,他们完成了线性网络,但当推进非线性大规模网络时,遇到了较大挑战。

虽然二者从理论上相对一致,但在实际过程中完成非线性网络并不容易,有时候课题组成员接连好几周都没有任何实验进展。

目前,薛智威在清华大学电子系博士三年级在读,据介绍,这是他博士期间的第一项工作,这项研究花了整整 3 年的时间认真打磨才最终开花结果。

回忆研究的实验过程,薛智威说道:“在北京冬日的一个凌晨,经过了很长时间的优化和调试后,此前一直不能很好工作的系统终于能够工作了,这意味着在实验上已经接近理论。我记得从实验室走出来的时候,感觉风都是甜的。”

清华团队提出新型光计算架构,光训练速度提升1个数量级

有望为后摩尔时代的 AI 大模型提供算力支撑

受物理光学特性启发,太极-II 提出了一种不基于电训练架构的技术路径。

以全前向光学传播模型来求解大规模网络训练难题,克服了计算精度差、训练速度慢、能量效率低的瓶颈,进而支撑多尺度复杂光学系统的高效、高精度在线训练。

据了解,当下研究团队已成功完成原理样片的制备,并向智能光芯片工业化方向推进,正在包括无人机、无人车、机器人等在内的端侧智能系统进行应用部署。

技术从学术界到工业界的转化是一个复杂的过程。尽管太极-II 芯片本身的能耗极低,但片上光源、片上光存储和外围电子设备的工程化进程方面,仍存在相关挑战。

为进一步探索和发展这些技术,研究团队正积极推进与产业界和科研机构的密切合作,以推动光芯片系统的进一步集成优化。

“我们希望在 2-3 年内实现光芯片与外围设备完整封装的产品级光计算系统,逐步实现芯片从专用应用到通用应用的转变。”薛智威表示。

太极-II 的面世,为智能光计算在大规模训练带来新的曙光,它与太极-I 将共同打造光算力新底座,为 AI 大模型训练和推理提供算力发展的新方案。

“太极”不仅是智能光计算系列芯片,更是光计算系统特有对偶属性的辩证协作架构。太极 I 和 II 正如其命名一样,既是分立的两个部分,又组合成一个统一的整体。

该团队通过太极-I 和太极-II 的相关研究,完成了对 AI 推理和训练的探索,它们又共同构成了大规模智能计算的整个生命周期,开启了智能光计算的新时代。

本次研究的完成,让人们看到了包括太极系列光芯片在内的智能光算力船帆的不懈航行,智能光计算平台终以解决 AI 算力所面临的问题为目标,将驶向 AI 算力的星辰大海,为绿色环保和高效率的 AI 大模型、通用人工智能等提供一种全新方案。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-08-09 12:45:01

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

中国科大实现超导体系 “量子计算优越性”新纪录
...机线路采样问题的速度比目前最快的超级计算机快15个数量级,超过谷歌2024年10月公开发表的最新成果6个数量级。这一成果是我国继超导量子计算原型机“祖冲之二号”实现超导量子计
2025-03-03 23:23:00
用最古朴思路“苦熬”光芯片
...每焦耳160万亿次运算,超越主流商用人工智能芯片3个数量级,为后摩尔时代高性能智能计算开辟了新路径。“太极”芯片首次赋能智能光计算,实现超过1000个类别的自然场景图像分类以
2024-05-28 23:16:00
清华大学获芯片领域重要突破!
...据介绍,太极光芯片的计算能效超现有智能芯片2—3个数量级,将可为百亿像素大场景光速智能分析、百亿参数大模型训练推理、毫瓦级低功耗自主智能无人系统提供算力支撑。文中图片均由受访
2024-04-12 10:19:00
光电融合新突破!清华大学建立光电智能计算架构—ACCEL芯片
...仅采用180nmCMOS工艺,已取得比7nm制程的高性能芯片多个数量级的性能提升。同时所使用的材料简单易得,造价仅为后者的几十分之一。图片来源:视频截图近年来,如何构建新的计
2023-11-05 13:34:00
百纳米完胜7纳米?清华团队提出全新芯片架构,成果已在《自然》杂志发表
...用180nm CMOS工艺,已取得比7纳米制程的高性能芯片多个数量级的性能提升。与此同时,其所使用的材料简单易得,造价仅为后者的几十分之一
2023-10-31 21:02:00
国内首款3D科学计算机!静安科技企业思朗科技发布“天穹”
...算机“天穹”,其相较传统二维架构超算系统快2—4个数量级,将为中国在全球人工智能与科学融合的新赛道中注入创新动能。当前,全球人工智能竞争进入新阶段,在《关于深入实施“人工智能
2026-01-15 17:08:00
超高速光电计算芯片“挣脱”摩尔定律
...0纳米CMOS工艺,比7纳米制程的高性能芯片性能提升多个数量级。与此同时,光电融合芯片所使用的材料简单易得,造价仅为高性能芯片的几十分之一。戴琼海表示,开发人工智能时代的全新
2023-11-02 07:05:00
清华大学开发超高速光电计算芯片,算力超 3000 倍
...用180nmCMOS工艺,已取得比7纳米制程的高性能芯片多个数量级的性能提升。与此同时,其所使用的材料简单易得,造价仅为后者的几十分之一。清华大学戴琼海院士、方璐副教授、乔飞
2023-10-30 22:09:00
科学家研发储备池计算机,无需任何光电,对应算力高达101TOPS
...品,在同等功耗之下,储备池光计算机的算力高出 1 个数量级,时延则能降低 3 到 4 个数量级。提出真问题,解决真矛盾对于人工智能来说,人们更多震撼于它的功能之强大。但是,它
2024-01-25 10:19:00
更多关于科技的资讯:
新春福利来袭!上纵览领顺丰福利券,燕赵家乡年味寄回家
新春将至年味漫卷街巷牵挂亦随团圆脚步愈发浓烈纵览新闻客户端携手顺丰速运重磅打造“年味传情,顺丰到家”新春寄递专属福利以实在优惠为每份心意添力即日起至3月3日打开纵览新闻客户端点击
2026-01-30 21:20:00
深耕快消品设计领域,北京博创设计以国际水准铸就品牌视觉力量
在国内高端品牌设计领域,北京博创设计公司(Bofly Design)凭借近二十年的深耕积淀,以专业的全链路服务能力、众多国际奖项背书及标杆级客户案例
2026-01-30 22:14:00
今天,我们需要一瓶什么样的酒?
多彩贵州网讯 作为一个普通消费者,走在超市琳琅满目的酒水区,或是滑动手机屏幕浏览五花八门的电商页面时,我们常常会停下来思考
2026-01-30 20:05:00
摘要:本文从家校社协同育人空间阻滞、文化断层问题出发,提出了以社区的微空间作为整合枢纽的设计思路。依靠功能复合化布局、地域文化元素的创新转化和VR/AR技术的虚实融合体验来创建起联系家庭
2026-01-30 17:40:00
日前,中国消费者协会将2026年消费维权年主题定为“提升消费品质”。这一主题旨在构建起“供给提质、维权提效、环境优化”的全链条治理体系
2026-01-30 17:47:00
中国消费者报报道(记者施本允)面对日均667件的海量消费投诉涌来,如何更准确有效地进行分流、处置?如何聚焦高风险业态进行预警
2026-01-30 17:47:00
中国消费者报上海讯(记者刘浩)上海市虹口区消费者权益保护委员会近日发布的宠物经济消费调查结果显示,90后、00后成为宠物消费主力
2026-01-30 18:17:00
省科学技术奖,锡山+6!
为激励企业自主创新、开放合作,更好地服务国家重大战略,推进江苏高质量发展,近期江苏省政府发布了《关于2024年度江苏省科学技术奖励的决定》
2026-01-30 18:20:00
今年春运期间,中国铁路南昌局南昌西动车组运用所的智能检修机器人将发挥重要作用,这款集成多重智能技术的“检修尖兵”,实现了动车组车厢底部全自动
2026-01-30 18:23:00
日前,中新经纬研究院与国家广告研究院联合发布报告《医药出海新图景》(下称《报告》)。这是双方推出的2025中国品牌出海系列报告第9期
2026-01-30 18:44:00
一口喜旺味,岁岁皆安康,解锁新年团圆仪式感
节庆馈赠的品质选择,源自对风险管控与生产闭环的极致追求。喜旺凭借其贯穿全链路的“风险驱动+全过程控制”体系,将“安心”转化为可测量
2026-01-30 14:53:00
新消费时代植物医生的 “空间重构”:从货架到生命场的 “实体进化”
“虚拟世界缺乏信任的最终载体,如果产品有问题,顾客可以找到你。这是线下店最根本的力量。”2026年1月初,在深圳举办年会时
2026-01-30 15:11:00
章丘首店!三联家电入驻世茂广场,2月6日盛大启幕!
鲁网1月29日讯三联家电,扎根齐鲁四十一载,“买家电,到三联,三联家电,保修终生”,这句话承载着几代人的回忆,随着家电市场的不断变迁
2026-01-30 15:31:00
娇韵诗撤下彩妆代言人金晨置顶微博
大皖新闻讯 1月30日下午,大皖新闻记者注意到,娇韵诗官方微博撤下彩妆代言人金晨相关的置顶内容。目前该微博账号置顶微博为迪丽热巴相关内容
2026-01-30 15:51:00
在经济全球化深入推进的背景下,跨境贸易已成为推动经济增长的重要引擎,而高效、安全的外汇服务则是保障跨境贸易顺畅开展的关键支撑
2026-01-30 16:02:00