• 我的订阅
  • 科技

sepphochreiter提出xlstm新架构

类别:科技 发布时间:2024-05-13 11:27:00 来源:浅语科技

5月13日消息,研究人员SeppHochreiter和JürgenSchmidhuber在1997年共同提出了长短期记忆(Longshort-termmemory,LSTM)神经网络结构,可用来解决循环神经网络(RNN)长期记忆能力不足的问题。

而最近SeppHochreiter在arXiv上发布论文,提出了一种名为xLSTM(ExtendedLSTM)的新架构,号称可以解决LSTM长期以来“只能按照时序处理信息”的“最大痛点”,从而“迎战”目前广受欢迎的Transformer架构。

sepphochreiter提出xlstm新架构

IT之家从论文中获悉,SeppHochreiter在新的xLSTM架构中采用了指数型门控循环网络,同时为神经网络结构引入了“sLSTM”和“mLSTM”两项记忆规则,从而允许相关神经网络结构能够有效地利用RAM,实现类Transformer“可同时对所有Token进行处理”的并行化操作。

sepphochreiter提出xlstm新架构

团队使用了150亿个Token训练基于xLSTM及Transformer架构的两款模型进行测试,在评估后发现xLSTM表现最好,尤其在“语言能力”方面最为突出,据此研究人员认为xLSTM未来有望能够与Transformer进行“一战”。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-05-13 16:45:01

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

科学家为脉冲神经网络引入新架构,为超大模型奠定基础
...一种类脑计算范式,一般是指在神经形态芯片上运行脉冲神经网络(Spiking Neural Network,SNN)
2024-03-18 10:41:00
爆火神经网络架构KAN更新2.0!可专属定制,轻松应对经典物理学
爆火神经网络架构KAN,上新了!KAN2.0。此次与科学问题更深入地融合,可以轻松解出经典物理学研究。比如发现拉格朗日量(用来描述整个物理系统动力状态的函数)除此之外,研究者还可
2024-08-22 09:52:00
清华团队提出新型光计算架构,光训练速度提升1个数量级
...对物理光计算的掣肘。该研究为光计算领域提供了大规模神经网络精准、高效的训练方法,为智能光计算系统的设计及开发提供了新思路,为光的计算能力开拓了新边界。审稿人对该研究评价称:“
2024-08-09 09:57:00
科学家研发储备池计算机,无需任何光电,对应算力高达101TOPS
...现多家光计算公司。当前的大部分光计算产品,旨在解决神经网络中矩阵运算的问题,即替代 GPU 或部分 GPU 的运算功能。当这类光计算产品的工作时,依旧需要在软件层面实现神经网
2024-01-25 10:19:00
智能驾驶的「 ChatCPT 时刻」,这么近,那么远
...架构呢?严格的定义是:从传感器输入到控制输出的单一神经网络模型。也就是这边信息输入进去,那一边结果输出出来,中间的过程交给神经网络模型处理。这个定义有点晦涩,不过跟智能驾驶的
2024-06-28 14:06:00
自适应神经连接光子处理器问世
...耦合相变材料制成的功能人工神经元。研究人员训练这个神经网络根据元音频率来区分德语和英语文本。图片来源:《科学进展》 科技日报北京10月25日电 (记者张梦然)德国明斯特大学、
2023-10-26 01:26:00
车路云一体化建设:三旺通信TSN方案构建智能交通神经网络
一个多雾的早晨,高速公路上能见度极低,智能感知设备检测到这一情况后,立即通过V2I通信向所有车辆发送警报,车载系统自动调整至智能引导模式,确保安全行驶。同一时间,一辆故障车停在应
2024-07-19 09:53:00
苹果A17 PRO到底PRO在哪?看完全明白了
...仍是2大性能核心+4小能效核心,5~6个GPU核心,以及16个神经网络引擎,大致上三者的变化并不大。于是我们根据Wiki百科目前公开的资料整理了A17PRO
2023-09-15 05:11:00
微云全息(NASDAQ: HOLO)引领图像压缩传感技术革新: HML-Net网络开创高效图像重建新纪元
...通信等,都有着广泛的应用前景。然而,建立一个有效的神经网络架构来解决图像CS问题一直是一个挑战。传统优化算法虽然在理论上提供了丰富的结构见解,但往往难以实现快速且稳定的图像重
2025-07-15 15:43:00
更多关于科技的资讯:
82岁老人换了新手机,但不熟悉操作,结果误开通多项收费业务。3月11日,老人收到扣费短信后向网格员求助,顺利取消了扣费服务
2026-03-11 17:36:00
中新经纬3月11日电 (董湘依)近年来,中国文化“新三样”(网文、网剧、网游)在海外迅速走红。全国两会期间,全国政协委员
2026-03-11 19:27:00
中新经纬3月11日电 题:“养龙虾”火出圈 ,算力变成稀缺资源作者 薛洪言 星图金融研究院常务副院长、苏商银行特约研究员2026年的早春
2026-03-11 19:28:00
河北新闻网讯(闫丽颖、唐福刚)近日,开滦股份范各庄矿聚焦“物理隔离+智能管控”核心需求,创新应用一套具备智能闭锁、声光报警
2026-03-11 19:51:00
中国联通eSIM尝鲜季再添新力
3月11日上午,中国联通eSIM尝鲜季——三星国内首款eSIM手机Galaxy S26系列首销仪式在西单北营业厅隆重举行
2026-03-11 14:14:00
大皖新闻讯 家里空调、冰箱等家电出故障,找维修却怕遇上“小病大修”“坐地起价”。别愁,专为安徽消费者打造的家电维修“放心平台”来了
2026-03-11 14:55:00
近日,备受瞩目的2025年度“吴文俊人工智能科学技术奖”获奖名单正式揭晓。罗普特(股票代码:688619.SH)作为主要完成单位参与的《面向海上安防的通感算一体化大数据智能处理关键技术及产业化》项目
2026-03-11 15:01:00
新华保险“空中柜面”让保单服务零距离
鲁网3月11日讯“您好,欢迎使用新华保险空中柜面服务!”当客户通过手机视频联系接通后台柜员时,这一句温暖的问候便会准时响起
2026-03-11 16:35:00
新华社记者 曾晋“你‘养龙虾’了吗?”这句略显无厘头的有趣问话,说的可是最近科技圈的一件大事。此“龙虾”并非餐桌上的美味
2026-03-11 16:02:00
长白时评评论员 丁铁巴基斯坦独立新闻社日前报道,曾是大型农场专属的现代农业机械化,正因中国农机驶入全球田间地头被改写,手工耕作的辛劳正被高效的机械作业替代
2026-03-11 11:32:00
降噪新科技,轻松听清晰,潜能发展更可期----科利耳Nucleus™ 8以创新聆听赋能成长
在移动互联高度发达的当下,听损人士的生活场景愈发多元:孩子们在游乐场嬉戏,笑声与广播声交织;学生们在校园里讨论,声音此起彼伏
2026-03-11 13:01:00
海湾深化转型,打造第二增长曲线
2025年,海湾安全技术有限公司(以下简称"海湾")迈入发展新阶段,在消防行业深度变革的浪潮中交出了一份亮眼的答卷。新年伊始
2026-03-11 13:02:00
八马以科技为翼,武夷山超级工厂破解茶行业非标发展桎梏
中国茶行业千年发展,却长期受困于“非标”痛点,品质参差、产能有限成为行业升级的最大阻碍。而作为“高端中国茶第一股”的八马茶业
2026-03-11 13:04:00
实现社保一站式便民服务厦门“汇智办”让缴费人“会自办”东南网3月11日讯(海峡导报记者 孙春燕 通讯员 杨楠欢 叶璐璐 廖皓宇) 受春节过后的“返工潮”影响
2026-03-11 13:46:00
探路制造出海“关键一跃”:华南师范大学调研团队走进华翱集团
面对复杂多变的国际环境,佛山制造业正迎来新一轮深度转型的关键期。从深耕国内市场到逐鹿全球蓝海,如何实现从单一“产品出海”向涵盖“技术-制造-品牌”的全链条出海跨越
2026-03-11 13:04:00