• 我的订阅
  • 科技

DeepSeek发布最新NSA技术论文!创始人梁文锋参与引人注目

类别:科技 发布时间:2025-02-19 12:26:00 来源:浅语科技

快科技2月19日消息,近日,DeepSeek在海外社交平台发布了一篇纯技术论文报告,其主要内容是关于NSA(即Natively Sparse Attention,原生稀疏注意力)。

与此同时,在论文署名中,第一作者袁景阳是在DeepSeek实习期间完成的这项研究。让人感到惊喜和意外的是,据论文署名排名,DeepSeek创始人梁文锋现身论文著作者之中,在作者排名中位列倒数第二。

DeepSeek发布最新NSA技术论文!创始人梁文锋参与引人注目

根据论文摘要,DeepSeek团队认为,业界越来越认识到长上下文建模对于下一代大型语言模型的重要性。然而,随着序列长度的增加,标准注意力机制的高复杂度成为了关键的延迟瓶颈。

据了解,NSA通过高效的长序列处理能力,使模型能够直接处理整本书籍、代码仓库或多轮对话(如千轮客服场景),扩展了大语言模型在文档分析、代码生成、复杂推理等领域的应用边界。

同时,NSA通过针对现代硬件的优化设计,在提高推理速度的同时、降低预训练成本,而不会牺牲性能。

它在通用基准测试、长文本任务和基于指令的推理中均能达到或超越全注意力模型的表现。

DeepSeek团队表示,稀疏注意力为提高效率同时保持模型能力,提供了一个有前景的方向。

公开资料显示,NSA(即Natively Sparse Attention,原生稀疏注意力)是一种用于超快速长文本训练与推理的、硬件对齐且可原生训练的稀疏注意力机制。

它专为长文本训练与推理设计,能够利用动态分层稀疏策略等方法,通过针对现代硬件的优化设计,显著优化传统AI模型在训练和推理过程中的表现。

DeepSeek发布最新NSA技术论文!创始人梁文锋参与引人注目

【本文结束】如需转载请务必注明出处:快科技

责任编辑:秋白

文章内容举报

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2025-02-19 14:45:08

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

...数人准备迎接新年时,DeepSeek团队向学术社区提交了一篇技术论文。这篇论文迅速在人工智能领域引起关注。论文的标题为《mHC:流形约束超连接》,由谢振达、魏毅轩、曹焕奇等研
2026-01-03 08:31:00
梁文锋杨植麟论文撞题,“注意力机制”对大模型意味着什么
...国产AI公司深度求索(DeepSeek)最新一篇论文引发关注,创始人梁文锋在署名之列,并2月16日提交到预印本平台arxiv
2025-02-19 18:43:00
...向“主导者”的转变——杭州纤纳光电科技有限公司联合创始人颜步一,以第一作者身份在《科学》发表光伏技术新突破;杭州深度求索人工智能基础技术研究有限公司创始人梁文锋,作为通讯作者
2025-12-30 17:52:00
DeepSeek,这条诞生在杭州的“鲸鱼” 这几天在全球科技圈、资本圈掀起滔天巨浪
...epSeek。他们的总部位于杭州,是“杭州四小龙”的代表,创始人梁文锋毕业于浙大,前不久刚被国务院总理李强接见。中国的大模型已经追上美国了?故事还得追溯到一个月前,1月23日
2025-01-28 07:53:00
DeepSeek创始人梁文锋:中国AI不可能永远跟随 必然有人站到技术的前沿
快科技1月27日消息,随着DeepSeek全球爆火,其创始人梁文锋从幕后走到了台前。20日下午,高层主持召开专家、企业家和教科文卫体等领域代表座谈会。此前,非常少露面的DeepS
2025-01-27 11:06:00
...集。2月18日,DeepSeek官方在海外社交平台X上发布了一篇纯技术论文报告,记者注意到,在这篇论文署名中,DeepSeek创始人梁文锋也作为共创在列
2025-02-23 16:04:00
浙大这本AI狂热分子们编写的免费电子书,火了
...学院及相关专业的名称,频繁出现在公众视野。深度探索创始人梁文锋本硕就读于信息与电子工程学院;云深处科技创始人朱秋国是浙大校友,也是控制科学与工程学院副教授;研发出全球最快四足
2025-02-27 21:50:00
年度生成式AI大会上海站公布最新嘉宾,报名进入最后阶段
...高端对话《大模型时代,资本市场的新风向》。枫清科技创始人兼CEO高雪峰、光羽芯辰创始人兼董事长周强、北电数智智算云负责人郭文、中昊芯英芯片软件栈负责人朱国梁、声网生成式AI产
2024-11-26 09:38:00
勇攀创新高峰 杭州成果3个月内再登《自然》杂志封面
...元,以“静待花开”的耐心陪跑每一个创新想法。据Rokid创始人祝铭明回忆,2023年,Rokid申报余杭区300万元的补贴
2025-12-17 07:58:00
更多关于科技的资讯:
厦门网讯(厦门日报记者 林桂桢)近日,2025年“职工技术创新成果奖”评选结果揭晓,国际货柜码头自主研发的“便携式夹轮器夹持力检测装置”项目获三等奖
2026-04-05 08:51:00
4月2日,唐槐电子装备与制造园区的山西智创新材料科技有限公司生产车间内,工作人员各司其职,干劲十足地忙生产、赶订单。今年以来
2026-04-05 07:02:00
近年来,生成式人工智能在人们生活中的应用越来越广。然而,在提供便利的同时,生成式人工智能也经常出现答非所问、信息不准确等“AI幻觉”现象
2026-04-05 07:33:00
从互联网平台发源地,到集聚超 80 家平台企业的产业高地,西湖区正以“顾问式服务”构筑更具活力的平台经济生态。日前,西湖区举行平台经济产业生态建设会议
2026-04-05 07:34:00
中新经纬4月4日电 (张芷菡)一个小篮子加上一把小铲子,钻进郊野就能收获春天。如今,挖野菜已从老年“养生局”变成了年轻人的“潮流局”
2026-04-04 20:12:00
4月4日,央视新闻客户端以《春暖花开换装忙换季消费带热“春日经济”》为题,报道了太原服装市场迎来换季消费高峰,春装热销持续拉动“春日经济”升温
2026-04-04 17:35:00
廊坊建成全国首个省级算力监测调度平台。
2026-04-04 18:26:00
中新经纬4月4日电 (宋亚芬)对于数以万计通过小包裹把“中国制造”卖往全球的中小电商来说,退货这条“回家路”曾困难重重
2026-04-04 18:04:00
近日,平安银行“基于iDeal平台的AI做市报价机器人项目”荣膺2025年深圳金融创新大赛二等奖。该大赛由深圳市地方金融管理局
2026-04-04 15:34:00
4月4日消息,千问AI打车清明假期订单量周环比增长超1500%,用户使用规模极速攀升。该功能于3月23日上线,距今不足两周
2026-04-04 11:41:00
千问3.6Plus大模型登顶全球模型调用排行榜首
4月4日消息,发布仅1天的千问新模型Qwen3.6-Plus,冲上全球知名大模型API调用平台OpenRouter的日榜榜首
2026-04-04 11:41:00
涌金楼丨浙企正在资本市场进行一场“春耕”
浙江企业正在资本市场进行一场“春耕”。截至3月31日,13家浙企登陆港交所、上交所、北交所。短短三个月,春意渐浓——这正是观察浙江产业升级的鲜活切面
2026-04-04 12:46:00
数智赋能新体验 山东移动高唐分公司助力宾馆智慧升级
鲁网4月3日讯随着人工智能、物联网等数字技术的快速发展,智慧化服务正加速融入日常生活。近日,山东移动高唐分公司充分发挥全光网络与云网能力
2026-04-04 08:27:00
中新经纬4月3日电 (宋亚芬)“人车家互联”迎来政策层面的推动。工信部等九部门近日联合印发的《推动物联网产业创新发展行动方案(2026-2028年)》中
2026-04-04 11:00:00
近日,世界超级摩托车锦标赛葡萄牙站赛场上传来好消息,中国摩托车制造商“张雪机车”以近4秒的绝对优势获得冠军,成绩断崖式碾压杜卡迪
2026-04-04 08:54:00