我的订阅
科技

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

DeepSeek发布最新NSA技术论文！创始人梁文锋参与引人注目

类别：科技发布时间：2025-02-19 12:26:00 来源：浅语科技

快科技2月19日消息，近日，DeepSeek在海外社交平台发布了一篇纯技术论文报告，其主要内容是关于NSA（即Natively Sparse Attention，原生稀疏注意力）。

与此同时，在论文署名中，第一作者袁景阳是在DeepSeek实习期间完成的这项研究。让人感到惊喜和意外的是，据论文署名排名，DeepSeek创始人梁文锋现身论文著作者之中，在作者排名中位列倒数第二。

根据论文摘要，DeepSeek团队认为，业界越来越认识到长上下文建模对于下一代大型语言模型的重要性。然而，随着序列长度的增加，标准注意力机制的高复杂度成为了关键的延迟瓶颈。

据了解，NSA通过高效的长序列处理能力，使模型能够直接处理整本书籍、代码仓库或多轮对话（如千轮客服场景），扩展了大语言模型在文档分析、代码生成、复杂推理等领域的应用边界。

同时，NSA通过针对现代硬件的优化设计，在提高推理速度的同时、降低预训练成本，而不会牺牲性能。

它在通用基准测试、长文本任务和基于指令的推理中均能达到或超越全注意力模型的表现。

DeepSeek团队表示，稀疏注意力为提高效率同时保持模型能力，提供了一个有前景的方向。

公开资料显示，NSA（即Natively Sparse Attention，原生稀疏注意力）是一种用于超快速长文本训练与推理的、硬件对齐且可原生训练的稀疏注意力机制。

它专为长文本训练与推理设计，能够利用动态分层稀疏策略等方法，通过针对现代硬件的优化设计，显著优化传统AI模型在训练和推理过程中的表现。

【本文结束】如需转载请务必注明出处：快科技

责任编辑：秋白

文章内容举报

以上内容为资讯信息快照，由td.fyun.cc爬虫进行采集并收录，本站未对信息做任何修改，信息内容不代表本站立场。

快照生成时间：2025-02-19 14:45:08

本站信息快照查询为非营利公共服务，如有侵权请联系我们进行删除。

信息原文地址：

更多关于文锋,技术论文,创始人,论文,技术,推理的资讯：

梁文锋发表署名论文提出大模型训练新架构

...数人准备迎接新年时，DeepSeek团队向学术社区提交了一篇技术论文。这篇论文迅速在人工智能领域引起关注。论文的标题为《mHC：流形约束超连接》，由谢振达、魏毅轩、曹焕奇等研

2026-01-03 08:31:00

梁文锋杨植麟论文撞题，“注意力机制”对大模型意味着什么

...国产AI公司深度求索（DeepSeek）最新一篇论文引发关注，创始人梁文锋在署名之列，并2月16日提交到预印本平台arxiv

2025-02-19 18:43:00

涌金楼丨浙江老板为何爱在“CNS”发论文？

...向“主导者”的转变——杭州纤纳光电科技有限公司联合创始人颜步一，以第一作者身份在《科学》发表光伏技术新突破；杭州深度求索人工智能基础技术研究有限公司创始人梁文锋，作为通讯作者

2025-12-30 17:52:00

DeepSeek，这条诞生在杭州的“鲸鱼” 这几天在全球科技

...epSeek。他们的总部位于杭州，是“杭州四小龙”的代表，创始人梁文锋毕业于浙大，前不久刚被国务院总理李强接见。中国的大模型已经追上美国了？故事还得追溯到一个月前，1月23日

2025-01-28 07:53:00

DeepSeek创始人梁文锋：中国AI不可能永远跟随必然有

快科技1月27日消息，随着DeepSeek全球爆火，其创始人梁文锋从幕后走到了台前。20日下午，高层主持召开专家、企业家和教科文卫体等领域代表座谈会。此前，非常少露面的DeepS

2025-01-27 11:06:00

DeepSeek低调参与GDC大会，宇树科技表演“机器人遛机

...集。2月18日，DeepSeek官方在海外社交平台X上发布了一篇纯技术论文报告，记者注意到，在这篇论文署名中，DeepSeek创始人梁文锋也作为共创在列

2025-02-23 16:04:00

浙大这本AI狂热分子们编写的免费电子书，火了

...学院及相关专业的名称，频繁出现在公众视野。深度探索创始人梁文锋本硕就读于信息与电子工程学院；云深处科技创始人朱秋国是浙大校友，也是控制科学与工程学院副教授；研发出全球最快四足

2025-02-27 21:50:00

年度生成式AI大会上海站公布最新嘉宾，报名进入最后阶段

...高端对话《大模型时代，资本市场的新风向》。枫清科技创始人兼CEO高雪峰、光羽芯辰创始人兼董事长周强、北电数智智算云负责人郭文、中昊芯英芯片软件栈负责人朱国梁、声网生成式AI产

2024-11-26 09:38:00

勇攀创新高峰杭州成果3个月内再登《自然》杂志封面

...元，以“静待花开”的耐心陪跑每一个创新想法。据Rokid创始人祝铭明回忆，2023年，Rokid申报余杭区300万元的补贴

2025-12-17 07:58:00

更多关于科技的资讯：

代表委员请留步｜拥抱“人工智能+”，加出新质生产力

视频摄制：冯阳霍艳恩赵新宇王思宁3月5日，北京。一场春雪为人民大会堂披上银装。十四届全国人大四次会议开幕会后，代表们陆续走出会场

2026-03-08 08:15:00

大会最前方vlog④丨她自闪耀

大河网讯（记者谢岚王紫仪贺志泉席茜）3月8日，我们把镜头对准全国人代会上的她身影，不定义她们该怎样，只记录她们正怎样。努力的她自闪耀！编辑：王晓颖审核：莫韶华

2026-03-08 09:08:00

花呗、信用卡分期等可享贴息！专家：有望释放年轻群体的消费潜力

【宅男财经｜财眼观两会】3月6日，财政部部长蓝佛安在十四届全国人大四次会议经济主题记者会上表示，对于老百姓日常消费，无论是商品还是服务

2026-03-08 09:34:00

“养虾”爆火，大厂纷纷布局！专家：将人力从机械性、流程化操作

【宅男财经｜专家面对面】近期OpenClaw(昵称“小龙虾”)爆火，腾讯、小米等大厂纷纷布局。知名经济学家、国研新经济研究院创始院长朱克力表示

2026-03-08 10:19:00

让这片土地孕育更多“小龙” 实验室“盆景”如何成为市场“风景

今年政府工作报告提出，“因地制宜发展新质生产力，建设现代化产业体系”，热门赛道人工智能无疑是代表委员热议的高频词。全国人大代表

2026-03-08 08:55:00

厦门机器人应用场景拓展空间大

市民游客和机器狗互动。活动现场，市民游客观看机器人机器狗表演。厦门网讯（文/图厦门日报记者谭心怡）机器人组团“上春晚”

2026-03-08 08:24:00

山东移动蓬莱分公司：赋能制造业数智转型，打造全场景视频协同新

胶东在线3月5日讯（通讯员常蕊徐冰鑫）近日，山东移动蓬莱分公司（以下简称“蓬莱移动”）成功助力烟台洛姆电子有限公司实现数智化升级

2026-03-08 03:03:00

300亿年误差不超过一秒！中国科大实现锶原子光晶格钟新突破

大皖新闻讯 3月7日，大皖新闻记者从中国科学技术大学获悉，近期该校潘建伟、戴汉宁、陈宇翱、彭承志等科研人员在光钟研制方面取得里程碑式进展

2026-03-07 17:23:00

“晋e行”注册用户突破300万

3月6日消息，“晋e行”作为山西高速公路出行服务的“数字大脑”，自2022年正式上线以来，以数字赋能为核心，标准化运营为抓手

2026-03-07 18:15:00

政声直达｜2026雄安国际机器人大赛征集机器人领域新技术新产

2026雄安国际机器人大赛征集机器人领域新技术新产品新场景。

2026-03-07 18:40:00

【财说明白】智能服务，未来像“水电网”一样方便

中新经纬3月7日电 (谢婧雯)你下班了，站在公司楼下，掏出手机。以前打车，要打开打车软件、输入目的地、比价、选车型、确认呼叫

2026-03-07 18:52:00

春晚机器人表演带火租赁市场厦门景区商超一机难求

东南网3月7日讯（海峡导报记者孙春燕／文陆军航／图）马年央视春晚，人形机器人的“赛博表演”惊艳全球，也带火了线下租赁市场

2026-03-07 14:21:00

【读图】回眸十四五，最感人至深的是…… 扫码阅读手机版

2026全国两会（策划郁建锋、王聪文案董琳晶设计贾静、杜珊、张晓钰）

2026-03-07 14:56:00

视频丨一部手机，链动智造千亿级产业集群

大河网讯一束微光照亮“智造”星系，璀璨的电子信息产业在郑州航空港拔节生长。在这里，产业星光汇聚成河，超千亿级集群汇聚了从芯片研发到整机组装的产业链

2026-03-07 16:14:00

全国人大代表刘庆峰：未来AI硬件会走进千家万户

大皖新闻讯 2026年是“十五五”开局之年，也是人工智能深度赋能千行百业的关键一年。正在召开的2026年全国两会上，人工智能毫无意外地成为代表委员们热议的高频词

2026-03-07 16:48:00

头条订阅服务

DeepSeek发布最新NSA技术论文！创始人梁文锋参与引人注目