• 我的订阅
  • 科技

让美国硅谷恐慌!中国工程院院士揭秘:DeepSeek究竟厉害在哪里

类别:科技 发布时间:2025-01-27 14:06:00 来源:浅语科技

快科技1月17日消息,在AI领域,DeepSeek带来的影响力,一点也不亚于“六代机”。那么,DeepSeek究竟厉害在哪里?

据新浪科技报道,今日,中国工程院院士、清华大学计算机系教授郑纬民指出了DeepSeek其成功出圈的关键所在。

让美国硅谷恐慌!中国工程院院士揭秘:DeepSeek究竟厉害在哪里

目前,业界对于DeepSeek的喜爱与赞美,主要集中在三个方面。

第一,在技术层面,DeepSeek背后的DeepSeek-V3及公司新近推出的DeepSeek-R1两款模型,分别实现了比肩OpenAI 4o和o1模型的能力。

第二,DeepSeek研发的这两款模型成本更低,仅为OpenAI 4o和o1模型的十分之一左右。

第三,DeepSeek把这一两大模型的技术都开源了,这让更多的AI团队,能够基于最先进同时成本最低的模型,开发更多的AI原生应用。

DeepSeek是如何实现模型成本的降低的呢?郑纬民指出,“DeepSeek自研的MLA架构和DeepSeek MOE架构,为其自身的模型训练成本下降,起到了关键作用。”

他指出,“MLA主要通过改造注意力算子压缩了KV Cache大小,实现了在同样容量下可以存储更多的KV Cache,该架构和DeepSeek-V3模型中FFN 层的改造相配合,实现了一个非常大的稀疏MoE 层,这成为DeepSeek训练成本低最关键的原因。”

据了解,KV Cache是一种优化技术,常被用于存储人工智能模型运行时产生的token的键值对(即key- value数值),以提高计算效率。

具体而言,在模型运算过程中,KV cache会在模型运算过程中充当一个内存库的角色,以存储模型之前处理过的token键值,通过模型运算计算出注意力分数,有效控制被存储token的输入输出,通过“以存换算”避免了多数大模型运算每次都是从第一个token开始运算的重复计算,提升了算力使用效率。

此外,据郑纬民透露,DeepSeek还解决了“非常大同时非常稀疏的MoE模型”使用的性能难题,而这也成了“DeepSeek训练成本低最关键的原因”。

“DeepSeek比较厉害的是训练MoE的能力,成为公开MoE模型训练中第一个能训练成功这么大MoE的企业。”郑纬民说

此外,DeepSeek还充分利用专家网络被稀疏激活的设计,限制了每个token被发送往GPU集群节点(node)的数量,这使得GPU之间通信开销稳定在较低的水位。

早先,图灵奖得主、主导Meta AI研究的首席科学家杨立昆(Yann LeCun)认为,DeepSeek成功的最大收获并非中国竞争对其他国家带来更大威胁,而是AI开源的价值使任何人都能受益。

“对那些看到DeepSeek表现并认为‘中国在AI领域正超越美国’的人而言,你的解读错了”,杨立昆在Threads写道,“正确解读应是‘开源模型正超越专有模型’”。

让美国硅谷恐慌!中国工程院院士揭秘:DeepSeek究竟厉害在哪里

【本文结束】如需转载请务必注明出处:快科技

责任编辑:朝晖

文章内容举报

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2025-01-27 17:45:05

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

2024中关村论坛闭幕 新质生产力成论坛“热词”
...工智能的触角更多的能够传递到各个领域和各个地方。”中国工程院院士张平中国工程院院士张平认为,新质生产力作为增量过程和技术,以新创质为核心,将为原有市场和新兴市场带来显著的提升
2024-04-29 17:19:00
...差距,专家认为,AI“飞入寻常百姓家”还有一定距离。中国工程院外籍院士、美国卡内基梅隆大学教授、1994年图灵奖获奖者罗杰·瑞迪(Raj Reddy)认为
2024-04-27 21:09:00
本文转自:三亚日报中国工程院院士、中国农业科学院原副院长万建民:构建以企业创新为主体的种业创新体系本报记者 刘盈盈 张慧膑 实习生 桂周琪 何承儒“我这次讲的是关于中国种业创新体
2024-03-18 03:21:00
合肥蜀山区这场“产品发布会” 为何让中国科大校长“欣然而至”
...多校友走进“科大硅谷”当天,来自中国科学技术大学、中国工程院、中国科学院、美国国家工程院的专家及相关企业代表也展开互动交流,共话产业未来与发展。包信和说,经过一年多的建设,“
2023-11-05 12:39:00
未来已来!多国人士将中国视为带动未来产业发展的重要国家
...在接下来全力发展人工智能,他们需要借助中国的经验。美国硅谷人工智能研究院院长皮埃罗·斯加鲁菲表示,新的技术为不同种类的科学开辟了新的可能性。如今,为创新做出贡献的国家并不多,
2024-04-27 14:51:00
2024外滩大会:以开放创新之姿,再架上海科技人文之桥
...Kelly(凯文·凯利),美国硅谷创业教父史蒂夫·霍夫曼,中国工程院院士、阿里云创始人王坚,香港科技大学校董会主席、美国工程院外籍院士沈向洋等多位学界、业界的领军人物,以及来
2024-09-07 17:24:00
周睿:起跑要趁早
...》。在加州大学伯克利分校学习时,周睿遇见了美国国家工程院院士富塚诚义。跟着这位自动化控制界的泰斗,周睿得以涉足自动驾驶、机器人等领域。迄今,周睿已经发表了多篇多模态AI研究和
2023-12-14 06:44:00
宁德时代:今年公司整体的定价策略没有发生变化
...行汽车品牌独立运营。调整首先从比亚迪的研发核心部门工程院开始,目前,工程院正计划成立多个新能源车品牌研究院,包括王朝研究院、海洋研究院、腾势研究院等。(36氪)激战插混市场,
2023-03-17 23:51:00
AI教母李飞飞3个月造出一个独角兽!
...觉信息进行高级推理。公开资料显示,李飞飞系美国国家工程院院士、美国国家医学院院士、美国艺术与科学院院士,任美国斯坦福大学首位红杉讲席教授,以人为本人工智能研究院(HAI)院长
2024-07-18 09:54:00
更多关于科技的资讯:
第八届进博会推出入境支付服务台,上海境外来华用户微信支付消费笔数同比增长160%
11月5日,第八届中国国际进口博览会(以下简称“进博会”)开幕。本届进博会将有155个国家、地区和国际组织参与,4108家境外企业参展
2025-11-06 20:20:00
上市“后备军”,钟楼+2!
近日,江苏省科技厅公布2025年度省科技企业上市培育计划拟入库企业名单,常州市共5家企业入选,其中钟楼区有2家,分别是
2025-11-06 09:09:00
□南京日报/紫金山新闻记者何洁实习生杨久久“人工智能+”专项赛中荣获特等奖!11月3日,在第十九届“挑战杯”中国移动全国大学生课外学术科技作品竞赛中
2025-11-06 07:46:00
记者走基层|巧搭“数字积木” 智绘梦想花园
10月29日,承德图布斯科技集团有限公司技术人员正在调试设计图。 河北日报记者 陈宝云摄10月29日,在承德图布斯科技集团有限公司(以下简称“图布斯公司”)的研发中心
2025-11-05 08:12:00
□曹清华党的二十届四中全会提出,实施新时代立德树人工程,促进思政课堂和社会课堂有效融合,加强体育、美育、劳动教育,完善教育评价体系
2025-11-05 08:16:00
2025年沪江网校课程质量高于预期:退费无忧+承诺与践行一致!
一、沪江网校简介为沪江教育旗下品牌,沪江网校自 2009 年成立以来,始终聚焦外语学习者需求,提供网校一对一,凭借专业教学服务与多元课程体系
2025-11-05 14:45:00
(一)开篇引言行业背景与痛点:中国信息通信研究院《2025年数字营销发展趋势报告》显示,2024年我国生成式引擎优化(GEO)市场规模已达47亿元
2025-11-05 14:47:00
在智能体产业快步迈入规模化的当下,南京正以软件产业的深厚积淀、政策生态的精准培育、应用场景的丰富储备,抢占AI科技革命新高点前几天
2025-11-05 15:06:00
Openloong开源社区亮相ROSCon China 2025大会,为智能开源注入新活力
10月31日至11月1日,ROSCon China 2025在上海虹桥新华联索菲特大酒店成功举办。这一汇聚了全球ROS领域顶尖专家与开发者的年度盛会
2025-11-05 15:29:00
职场“反内卷”调研报告 干货多多
近日,智联招聘《职场“反内卷”调研报告》,探究职场人对于“反内卷”的真实态度与选择,了解企业的相应举措。今年“多家知名企业实施强制下班”的新闻冲上热搜
2025-11-05 15:32:00
鲁网11月5日讯“真没想到,资金难题这么快就解决了!东平农商银行的‘同心乐商贷’真是及时雨,我的蛋糕房终于要开起来了。”近日
2025-11-05 15:55:00
中国联通(青岛)智算中心DC1获评“2025年度国家绿色数据中心”
鲁网11月5日讯10月27日,工业和信息化部节能与综合利用司发布《2025年度国家绿色数据中心名单公示》,中国联通(青岛)智算中心DC1荣获“2025年度国家绿色数据中心”称号
2025-11-05 15:57:00
10月19日至20日,2025世界VR产业大会在南昌举行,来自全球VR领域的专家学者、领军企业和业界精英齐聚南昌,共同探讨VR与AI融合发展的新趋势
2025-11-05 17:44:00
语言、技能与数字化:培生亮相CACIE 2025,共筑未来教育新生态
2025年10月29日至11月1日,第26届中国国际教育年会(CACIE)在北京国家会议中心举行。全球终身学习公司培生(FTS: PSON
2025-11-05 18:00:00
找对 “充电站”,心理从业者进阶不迷路!灵动生活集团幸福心理商学苑全维护航
“考下资格证却接不到个案,能做咨询却不懂怎么运营工作室”—— 这是国内超 70% 心理从业者入行后都会遇到的 “成长困境”
2025-11-05 18:01:00