• 我的订阅
  • 科技

DeepSeek发布最新NSA技术论文!创始人梁文锋参与引人注目

类别:科技 发布时间:2025-02-19 12:26:00 来源:浅语科技

快科技2月19日消息,近日,DeepSeek在海外社交平台发布了一篇纯技术论文报告,其主要内容是关于NSA(即Natively Sparse Attention,原生稀疏注意力)。

与此同时,在论文署名中,第一作者袁景阳是在DeepSeek实习期间完成的这项研究。让人感到惊喜和意外的是,据论文署名排名,DeepSeek创始人梁文锋现身论文著作者之中,在作者排名中位列倒数第二。

DeepSeek发布最新NSA技术论文!创始人梁文锋参与引人注目

根据论文摘要,DeepSeek团队认为,业界越来越认识到长上下文建模对于下一代大型语言模型的重要性。然而,随着序列长度的增加,标准注意力机制的高复杂度成为了关键的延迟瓶颈。

据了解,NSA通过高效的长序列处理能力,使模型能够直接处理整本书籍、代码仓库或多轮对话(如千轮客服场景),扩展了大语言模型在文档分析、代码生成、复杂推理等领域的应用边界。

同时,NSA通过针对现代硬件的优化设计,在提高推理速度的同时、降低预训练成本,而不会牺牲性能。

它在通用基准测试、长文本任务和基于指令的推理中均能达到或超越全注意力模型的表现。

DeepSeek团队表示,稀疏注意力为提高效率同时保持模型能力,提供了一个有前景的方向。

公开资料显示,NSA(即Natively Sparse Attention,原生稀疏注意力)是一种用于超快速长文本训练与推理的、硬件对齐且可原生训练的稀疏注意力机制。

它专为长文本训练与推理设计,能够利用动态分层稀疏策略等方法,通过针对现代硬件的优化设计,显著优化传统AI模型在训练和推理过程中的表现。

DeepSeek发布最新NSA技术论文!创始人梁文锋参与引人注目

【本文结束】如需转载请务必注明出处:快科技

责任编辑:秋白

文章内容举报

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2025-02-19 14:45:08

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

...数人准备迎接新年时,DeepSeek团队向学术社区提交了一篇技术论文。这篇论文迅速在人工智能领域引起关注。论文的标题为《mHC:流形约束超连接》,由谢振达、魏毅轩、曹焕奇等研
2026-01-03 08:31:00
梁文锋杨植麟论文撞题,“注意力机制”对大模型意味着什么
...国产AI公司深度求索(DeepSeek)最新一篇论文引发关注,创始人梁文锋在署名之列,并2月16日提交到预印本平台arxiv
2025-02-19 18:43:00
...向“主导者”的转变——杭州纤纳光电科技有限公司联合创始人颜步一,以第一作者身份在《科学》发表光伏技术新突破;杭州深度求索人工智能基础技术研究有限公司创始人梁文锋,作为通讯作者
2025-12-30 17:52:00
DeepSeek,这条诞生在杭州的“鲸鱼” 这几天在全球科技圈、资本圈掀起滔天巨浪
...epSeek。他们的总部位于杭州,是“杭州四小龙”的代表,创始人梁文锋毕业于浙大,前不久刚被国务院总理李强接见。中国的大模型已经追上美国了?故事还得追溯到一个月前,1月23日
2025-01-28 07:53:00
DeepSeek创始人梁文锋:中国AI不可能永远跟随 必然有人站到技术的前沿
快科技1月27日消息,随着DeepSeek全球爆火,其创始人梁文锋从幕后走到了台前。20日下午,高层主持召开专家、企业家和教科文卫体等领域代表座谈会。此前,非常少露面的DeepS
2025-01-27 11:06:00
...集。2月18日,DeepSeek官方在海外社交平台X上发布了一篇纯技术论文报告,记者注意到,在这篇论文署名中,DeepSeek创始人梁文锋也作为共创在列
2025-02-23 16:04:00
浙大这本AI狂热分子们编写的免费电子书,火了
...学院及相关专业的名称,频繁出现在公众视野。深度探索创始人梁文锋本硕就读于信息与电子工程学院;云深处科技创始人朱秋国是浙大校友,也是控制科学与工程学院副教授;研发出全球最快四足
2025-02-27 21:50:00
年度生成式AI大会上海站公布最新嘉宾,报名进入最后阶段
...高端对话《大模型时代,资本市场的新风向》。枫清科技创始人兼CEO高雪峰、光羽芯辰创始人兼董事长周强、北电数智智算云负责人郭文、中昊芯英芯片软件栈负责人朱国梁、声网生成式AI产
2024-11-26 09:38:00
勇攀创新高峰 杭州成果3个月内再登《自然》杂志封面
...元,以“静待花开”的耐心陪跑每一个创新想法。据Rokid创始人祝铭明回忆,2023年,Rokid申报余杭区300万元的补贴
2025-12-17 07:58:00
更多关于科技的资讯:
第17期监制:杨春红制作:王金顺记者:牛思家
2026-01-20 16:59:00
黄桥街道举办“智启AI:与机器人对话初体验”科普宣传活动
江南时报讯 为了让科学的种子在下一代心中萌芽,让抽象的技术原理转化为可触可感的亲身经历,近日,苏州市相城区黄桥街道举办“智启AI
2026-01-20 17:05:00
大江奔涌,潮起东方。2026年1月15日,陆家嘴国泰人寿第8届年度盛典暨2025年度菁英表彰会在江苏南京盛大开启。两百多位从全国各地星聚而来的“国泰人”
2026-01-20 14:26:00
当“钢铁战士”遭遇网络黑客:“鹏城杯”国内首次机器人场景网络安全攻防演练
1月19日,第五届“鹏城杯”国内首次机器人场景网络安全攻防赛事正式落下帷幕。此次赛事吸引了全国500余支队伍,超1600名高校学子
2026-01-20 14:27:00
AI赋能课堂 素养引领教学——济南市莱芜第一中学64级生物论坛精彩开讲
鲁网1月20日讯为探索AI技术与生物课堂融合的新路径,近日,济南市莱芜第一中学64级生物组举办了高三生物学科论坛。本次论坛聚焦AI技术在生物课堂教学中的应用
2026-01-20 14:28:00
产品力 | 越秀写字楼代装2.0产品焕新登场:四大价值赋能企业全生命周期成长
经济复苏提速叠加新兴产业爆发,写字楼市场正迎来品质升级的关键周期。对企业而言,“降本增效、长效增长”已成核心诉求,商办空间早已超越物理办公载体的属性
2026-01-20 14:30:00
2026年1月15日,沙特当地时间上午8时,东方雨虹旗下子公司天鼎丰沙特工厂 1、2 号生产线正式投产运行。这一成果不仅是公司全球化进程中的重要节点
2026-01-20 14:46:00
安顺中泰鑫博铝业:技术创新铸就产业升级新引擎
作为安顺市西秀区产业升级重点引进项目,安顺中泰鑫博铝业以技术革新为核心引擎,通过技改优化、产品升级与供应链重塑,激活闲置国有资产
2026-01-20 16:58:00
“小小超人穿衣魔法营”收官 解锁自理新技能
江南时报讯 截至2025年12月,周庄镇目前登记在册的智力/精神障碍儿童共11名,其康复与生活支持需求呈现多元化与差异化特点
2026-01-20 15:45:00
舒朗秋AI写诗、作画已经不新鲜了,但如果您买了一本教人摄影的专业书籍,回家却发现书里的模特长着六根手指,光影全是错乱的
2026-01-20 15:47:00
2026静脉曲张袜测评:medi迈迪让你告别腿部肿胀与疲劳
在需要长时间站立或久坐的现代生活中,腿部酸胀、沉重甚至出现静脉曲张,已成为教师、护士、程序员、孕妇等众多人群的常见困扰
2026-01-20 16:12:00
近日,百年人寿保险股份有限公司与全景医学影像科技股份有限公司正式开启战略合作,为客户构建以精准预防为核心的健康保障全新模式
2026-01-20 16:31:00
对话全球智造先锋 主持人刘美希深度探访2025世界机器人大会
日前,2025世界机器人大会在北京盛大启幕,5万平方米的展览空间内,1240余家全球知名企业、高校及科研机构齐聚一堂,集中展示机器人领域最新科研成果与应用解决方案
2026-01-20 16:15:00
有哪些值得推荐的弹力袜品牌?medi迈迪医疗级护腿,专业之选
对于长期站立、久坐办公、孕期女性以及已有静脉曲张症状的人群来说,一双专业的医疗级弹力袜(压力袜)不仅是缓解腿部疲劳的日用品
2026-01-20 16:15:00
京东集团宣布成立京东美术馆,以艺术与科技链接世界
1月20日,京东集团正式宣布成立京东美术馆(JD Museum)。京东美术馆是一所当代视觉、表演艺术及文化机构,坐落于深圳湾超级总部基地
2026-01-20 13:34:00