• 我的订阅
  • 科技

DeepSeek发布最新NSA技术论文!创始人梁文锋参与引人注目

类别:科技 发布时间:2025-02-19 12:26:00 来源:浅语科技

快科技2月19日消息,近日,DeepSeek在海外社交平台发布了一篇纯技术论文报告,其主要内容是关于NSA(即Natively Sparse Attention,原生稀疏注意力)。

与此同时,在论文署名中,第一作者袁景阳是在DeepSeek实习期间完成的这项研究。让人感到惊喜和意外的是,据论文署名排名,DeepSeek创始人梁文锋现身论文著作者之中,在作者排名中位列倒数第二。

DeepSeek发布最新NSA技术论文!创始人梁文锋参与引人注目

根据论文摘要,DeepSeek团队认为,业界越来越认识到长上下文建模对于下一代大型语言模型的重要性。然而,随着序列长度的增加,标准注意力机制的高复杂度成为了关键的延迟瓶颈。

据了解,NSA通过高效的长序列处理能力,使模型能够直接处理整本书籍、代码仓库或多轮对话(如千轮客服场景),扩展了大语言模型在文档分析、代码生成、复杂推理等领域的应用边界。

同时,NSA通过针对现代硬件的优化设计,在提高推理速度的同时、降低预训练成本,而不会牺牲性能。

它在通用基准测试、长文本任务和基于指令的推理中均能达到或超越全注意力模型的表现。

DeepSeek团队表示,稀疏注意力为提高效率同时保持模型能力,提供了一个有前景的方向。

公开资料显示,NSA(即Natively Sparse Attention,原生稀疏注意力)是一种用于超快速长文本训练与推理的、硬件对齐且可原生训练的稀疏注意力机制。

它专为长文本训练与推理设计,能够利用动态分层稀疏策略等方法,通过针对现代硬件的优化设计,显著优化传统AI模型在训练和推理过程中的表现。

DeepSeek发布最新NSA技术论文!创始人梁文锋参与引人注目

【本文结束】如需转载请务必注明出处:快科技

责任编辑:秋白

文章内容举报

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2025-02-19 14:45:08

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

...数人准备迎接新年时,DeepSeek团队向学术社区提交了一篇技术论文。这篇论文迅速在人工智能领域引起关注。论文的标题为《mHC:流形约束超连接》,由谢振达、魏毅轩、曹焕奇等研
2026-01-03 08:31:00
梁文锋杨植麟论文撞题,“注意力机制”对大模型意味着什么
...国产AI公司深度求索(DeepSeek)最新一篇论文引发关注,创始人梁文锋在署名之列,并2月16日提交到预印本平台arxiv
2025-02-19 18:43:00
...向“主导者”的转变——杭州纤纳光电科技有限公司联合创始人颜步一,以第一作者身份在《科学》发表光伏技术新突破;杭州深度求索人工智能基础技术研究有限公司创始人梁文锋,作为通讯作者
2025-12-30 17:52:00
DeepSeek,这条诞生在杭州的“鲸鱼” 这几天在全球科技圈、资本圈掀起滔天巨浪
...epSeek。他们的总部位于杭州,是“杭州四小龙”的代表,创始人梁文锋毕业于浙大,前不久刚被国务院总理李强接见。中国的大模型已经追上美国了?故事还得追溯到一个月前,1月23日
2025-01-28 07:53:00
DeepSeek创始人梁文锋:中国AI不可能永远跟随 必然有人站到技术的前沿
快科技1月27日消息,随着DeepSeek全球爆火,其创始人梁文锋从幕后走到了台前。20日下午,高层主持召开专家、企业家和教科文卫体等领域代表座谈会。此前,非常少露面的DeepS
2025-01-27 11:06:00
...集。2月18日,DeepSeek官方在海外社交平台X上发布了一篇纯技术论文报告,记者注意到,在这篇论文署名中,DeepSeek创始人梁文锋也作为共创在列
2025-02-23 16:04:00
浙大这本AI狂热分子们编写的免费电子书,火了
...学院及相关专业的名称,频繁出现在公众视野。深度探索创始人梁文锋本硕就读于信息与电子工程学院;云深处科技创始人朱秋国是浙大校友,也是控制科学与工程学院副教授;研发出全球最快四足
2025-02-27 21:50:00
年度生成式AI大会上海站公布最新嘉宾,报名进入最后阶段
...高端对话《大模型时代,资本市场的新风向》。枫清科技创始人兼CEO高雪峰、光羽芯辰创始人兼董事长周强、北电数智智算云负责人郭文、中昊芯英芯片软件栈负责人朱国梁、声网生成式AI产
2024-11-26 09:38:00
勇攀创新高峰 杭州成果3个月内再登《自然》杂志封面
...元,以“静待花开”的耐心陪跑每一个创新想法。据Rokid创始人祝铭明回忆,2023年,Rokid申报余杭区300万元的补贴
2025-12-17 07:58:00
更多关于科技的资讯:
视频摄制:冯阳 霍艳恩 赵新宇 王思宁3月5日,北京。一场春雪为人民大会堂披上银装。十四届全国人大四次会议开幕会后,代表们陆续走出会场
2026-03-08 08:15:00
大河网讯(记者 谢岚 王紫仪 贺志泉 席茜)3月8日,我们把镜头对准全国人代会上的她身影,不定义她们该怎样,只记录她们正怎样。努力的她自闪耀!编辑:王晓颖审核 :莫韶华
2026-03-08 09:08:00
【宅男财经|财眼观两会】3月6日,财政部部长蓝佛安在十四届全国人大四次会议经济主题记者会上表示,对于老百姓日常消费,无论是商品还是服务
2026-03-08 09:34:00
【宅男财经|专家面对面】近期OpenClaw(昵称“小龙虾”)爆火,腾讯、小米等大厂纷纷布局。知名经济学家、国研新经济研究院创始院长朱克力表示
2026-03-08 10:19:00
今年政府工作报告提出,“因地制宜发展新质生产力,建设现代化产业体系”,热门赛道人工智能无疑是代表委员热议的高频词。全国人大代表
2026-03-08 08:55:00
厦门机器人应用场景拓展空间大
市民游客和机器狗互动。活动现场,市民游客观看机器人机器狗表演。厦门网讯(文/图 厦门日报记者 谭心怡)机器人组团“上春晚”
2026-03-08 08:24:00
胶东在线3月5日讯(通讯员常蕊徐冰鑫)近日,山东移动蓬莱分公司(以下简称“蓬莱移动”)成功助力烟台洛姆电子有限公司实现数智化升级
2026-03-08 03:03:00
300亿年误差不超过一秒!中国科大实现锶原子光晶格钟新突破
大皖新闻讯 3月7日,大皖新闻记者从中国科学技术大学获悉,近期该校潘建伟、戴汉宁、陈宇翱、彭承志等科研人员在光钟研制方面取得里程碑式进展
2026-03-07 17:23:00
3月6日消息,“晋e行”作为山西高速公路出行服务的“数字大脑”,自2022年正式上线以来,以数字赋能为核心,标准化运营为抓手
2026-03-07 18:15:00
2026雄安国际机器人大赛征集机器人领域新技术新产品新场景。
2026-03-07 18:40:00
中新经纬3月7日电 (谢婧雯)你下班了,站在公司楼下,掏出手机。以前打车,要打开打车软件、输入目的地、比价、选车型、确认呼叫
2026-03-07 18:52:00
春晚机器人表演带火租赁市场 厦门景区商超一机难求
东南网3月7日讯(海峡导报记者 孙春燕/文 陆军航/图)马年央视春晚,人形机器人的“赛博表演”惊艳全球,也带火了线下租赁市场
2026-03-07 14:21:00
【读图】回眸十四五,最感人至深的是…… 扫码阅读手机版
2026全国两会(策划 郁建锋、王聪 文案 董琳晶 设计 贾静、杜珊、张晓钰)
2026-03-07 14:56:00
大河网讯 一束微光照亮“智造”星系,璀璨的电子信息产业在郑州航空港拔节生长。在这里,产业星光汇聚成河,超千亿级集群汇聚了从芯片研发到整机组装的产业链
2026-03-07 16:14:00
全国人大代表刘庆峰:未来AI硬件会走进千家万户
大皖新闻讯 2026年是“十五五”开局之年,也是人工智能深度赋能千行百业的关键一年。正在召开的2026年全国两会上,人工智能毫无意外地成为代表委员们热议的高频词
2026-03-07 16:48:00