• 我的订阅
  • 社会

DeepSeek 的“修炼”之路,还要闯几关?

类别:社会 发布时间:2025-02-28 10:48:00 来源:缘之心

以小博大、逆袭吊打,曾是修仙爽文、微短剧里让人上头却略显荒诞的剧情,而今,DeepSeek(深度求索)让它在真实世界里发生了。

火爆全球超过一个月,DeepSeek掀起的风暴还在持续,随之而来的还有一波三折的戏码,同行的围剿、跨界的争议……正如影视作品中每一位“爽文大女主”升级打怪时所面对的关卡一样。

誉满天下,谤亦随之,DeepSeek的“修炼”之路,还要闯几关?

“爽文大女主”出三招

悄悄推出两款模型,即引发硅谷与华尔街的剧烈震荡,让OpenAI接连推出竞争产品并免费开放搜索,谷歌一股脑儿发布“满血版全家桶”,国内大厂的旗舰模型也开始免费开放。

深有“天上掉馅饼”之感的万千普通用户,倒是想给DeepSeek送锦旗了,不过,大家也想知道,凭一己之力就把曾经高不可攀的全球最顶级大模型的价格打下来了,究竟用了什么招?

——“乱”拳打伤老师傅。从架构到工程,从算法到部署,DeepSeek悟透的是“四两拨千斤”的中国武术古训,不理会“参数规模决定论”,反倒是秀出了数据质量优化与算法架构创新的乘数效应,在看似不可能的壁垒中突围。

——拆掉半壁卫城墙。一般来说,大模型开发者用了英伟达的GPU,也就得用他家的运算平台CUDA搞研发。毕竟CUDA已经封装好一些函数,后来者使用时直接调用接口搞加工就行,这样的低门槛当然方便资源有限的开发者,但是,这也意味着深度研发执行效率的折扣。

绕过CUDA,直接基于GPU的驱动函数开发,行不行?DeepSeek给出了肯定的答案。凭借独到软件算法优化,拆掉英伟达“卫城墙”,也就是不必仰赖其CUDA生态行事,DeepSeek走出了一条中国AI技术创新的新路子。

——小力也能出奇迹。自从OpenAI的ChatGPT发布以来,微软、谷歌、Meta等科技巨头一直在增加与人工智能相关的算力支出。“军备竞赛”式的投入,也催动了美国AI芯片股价一路攀升。

就当行业仍困囿于“算力军备竞赛”的思维定式之际,DeepSeek凭借区区558万美元训练成本就让V3模型达到了GPT-4o九成功力,R1模型更实现以纯强化学习突破推理能力边界,向世界证明,AI大模型的革命,不一定要靠算力堆出来。

是幻觉还是“真香”

DeepSeek的小而精、强且美,是炒作出来的“幻觉”,还是厚积薄发而得的“真香”?

自从在AI江湖中亮出名号,DeepSeek就不满足于追随者,这可以从其开发的一系列原创技术获得证明。MLA、GRPO、R1-Zero……门外汉对着这些字母大概会如坠五里雾中,但是,这些技术合力激发的“聚变”,恐怕是DeepSeek获得140多个国家用户认可的根本原因。

北京白领小游说,DeepSeek的回答不像GPT的回答那么干巴巴,像个只会写材料的书呆子,按部就班安排任务步骤,而像个鬼马精灵,只要你说明目的,她就能拆解和揣摩你的弦外之音、思考怎么实现你想要的:“甚至你可以问她一些你都没有答案的大问题。”

当然,DeepSeek依然在蓬勃的成长期。以最新的DeepSeek-R1为例,虽然其突破鼓舞人心,但学术界用起来还不免有点头疼——面对悠远文明时间中的复杂因果,现代学术论述的复杂规范,DeepSeek的回答还不免左支右绌。

而且,DeepSeek暂时还不谙图像处理,回应大规模用户需求也有“体力不支”的情况,这些困难都意味着,DeepSeek的修炼,“高原期”刚刚开始。

如何学习文明的智慧

技术革命的浪潮里,没有永恒的王者,只有不断的超越。具体到AI领域,大家的共识更是:充满不确定性、一直充满热度、但不乏过度反应。

无休止的波动,折射出的,其实是科技进化的深层图像——人工智能,就好像之前种种引发文明革命的重大科技进展一样,前进路线并非笔直的线性轨迹,而是永恒的螺旋。

谁来驱动这螺旋?不论DeepSeek参演的是爽剧还是正剧,角色与剧本背后的导演还是人类自己。

如果说AI是普罗米修斯之火,那么人类文明就是在自我颠覆中奔流不息、江声浩荡的赫拉克利特之河。我们最珍贵的不是回答和解决已有问题的能力,而是发现新问题的智慧、定义新问题的勇气——这更需要创造性与想象力。

DeepSeek式创新的下一次突破,其通关密码,就生成于回向文明深处寻求思考变革的努力中。以文明赋能人工智能,人工智能的“飞升”时刻,也许就会到来。

原标题《DeepSeek的修炼之路》

半月谈记者:张漫子

(半月谈微信公众号)【编辑:张子怡】

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2025-02-28 14:45:01

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

首届中国大模型大会在北京举行
...。主办方供图人民网北京6月20日电 (焦磊)大模型作为人工智能领域的技术新高地,正加速赋能千行百业。6月18日至19日,以“中国大模型之路”为主题的首届中国大模型大会(CLM
2024-06-20 17:17:00
...是来自临平的地卫二空间技术(杭州)有限公司所展示的人工智能卫星“地卫智能应急一号”首发产品,该卫星能在太空中利用人工智能算力进行在轨数据分析和处理,极大提升了卫星数据的使用效
2023-11-27 06:24:00
《三星堆:未来启示录》AIGC赋能古文明科幻短剧集
由博纳影业AIGMS制作中心,联合抖音、即梦AI生成式人工智能创作平台,出品并制作的AI生成式连续性叙事科幻短剧《三星堆:未来启示录》第一季,揭开一段跨越时空的古文明探险旅程,开
2024-06-17 17:53:00
李彦宏:AI原生应用比大模型数量更重要
...》的演讲。大模型是当下全球科技创新的焦点,也是全球人工智能竞赛的主战场。李彦宏认为,“新的国际竞争战略关键点,不是一个国家有多少个大模型,而是你的大模型上有多少原生的AI应用
2023-06-26 19:20:00
2023全球数字经济大会人工智能高峰论坛: 探讨北京大模型的发展之路
2023全球数字经济大会人工智能高峰论坛于7月2日在北京中关村国家自主创新示范区会议中心举行。本次论坛以“智能涌现,重塑未来”为主题,旨在探讨通用人工智能大模型发展等热点议题,助
2023-07-04 10:08:00
B站AI课几秒出总结,划词就给解释,这个「AI学习搭子」真香
...」功能时,大家如获至宝。以李宏毅最近开设的《生成式人工智能导论》这门课为例,在点开之前,我们还担心,这门课会不会要求很高。结果,看了豆包总结的第一讲概要,这种顾虑就打消了。为
2024-07-27 09:29:00
...世界,数字技术正全面融入人类社会的各领域和全过程,人工智能已然成为人类文明进步的一个重要标志。与此同时,数字技术如果失去了规范和约束,就可能成为“潘多拉魔盒”,给现实社会带来
2023-06-26 20:58:00
全球人工智能发展,可能还会走上核武竞争的老路
“如何回应人工智能带来的挑战?我们可以从中华文明和中国式现代化中汲取智慧。”“通用人工智能会催生重大的技术和产业创新,可能会导致行业生态的重新洗牌。”在东方卫视8月7日播出的《这
2023-08-14 10:05:00
...人周鸿祎也针对这一话题发表演讲。周鸿祎表示,过去的人工智能是弱人工智能,在此基础上打造的智能硬件不具有真正的智能。大模型出现后,计算机第一次真正的理解这个世界,并能够赋予AI
2023-06-02 01:09:00
更多关于社会的资讯:
上饶银行弋阳支行与弋阳县民营(个私)经济协会签署战略合作协议
9月10日,上饶银行弋阳支行与弋阳县民营(个私)经济协会签署战略合作仪式。此次战略合作主要围绕两大核心方向展开:一是强化金融服务供给
2025-09-12 17:41:00
国家金融监督管理总局近日发布的《关于进一步提升金融服务适老化水平的指导意见》明确提出,金融机构要优化传统与智能化服务,让老年人在金融服务中更有获得感
2025-09-12 17:43:00
走进沂蒙“大先生”|临沂启航中学魏代玲:在平凡的岗位上书写不平凡的教育篇章
【编者按】一万步卷帙浩繁的世界,最初,都由良师开卷。在沂蒙大地,一代代优秀教师将拳拳之心倾注教育事业,照亮莘莘学子筑梦之路
2025-09-12 17:44:00
最近,东营一家做外贸生意的企业负责人王经理总算松了口气。手里那笔等着用的外币回款,原本卡在入账环节,急得他嘴上起了好几个泡
2025-09-12 17:44:00
大众网记者 邓梦娇 梁红国 王雪 临沂报道
2025-09-12 17:48:00
全省首次!全国第二例!山东省二院完成新一代人工耳蜗“首秀”
在24岁小华(化名)的童年记忆里,声音是模糊而遥远的。3岁多时,一场突如其来的听力下降,被诊断为“大前庭导水管综合征”
2025-09-12 17:52:00
夏日炎炎,烈日炙烤下的柏油路面滚烫难耐。近日,在建设银行东营胜南支行附近市场摆摊卖桃的张阿姨,吆喝许久后嗓子干渴不已。想起环卫工人李大爷曾提及建行设有 “劳动者港湾” 可免费喝水
2025-09-12 17:52:00
“死亡线上救亲人,医术高超创奇迹”,近日,一面沉甸甸的锦旗被患者家属郑重送到济南医院内科一病区医护人员手中。红色锦缎上的鎏金大字
2025-09-12 17:54:00
海南地矿:慰问患病员工传递组织温情
消费日报网讯(记者 郑红梅 □黄湘燕 王成龙)“有困难,找组织,集团与你一起共渡难关!”近日,海南地矿集团下属海南地质物业管理有限公司员工冼泽荣患病的消息
2025-09-12 17:56:00
金熊猫首届剧本创投活动成功举办 峨影集团携优质成果助力影视产业高质量发展
消费日报网讯(记者 罗颖)9月11日,第二届金熊猫奖“熊猫带你看世界”影视项目发布成功举办,由中宣部电影剧本规划策划中心
2025-09-12 17:56:00
消费日报网讯(记者 刘自昌)9月12日,记者从2025年中国国际服务贸易交易会山西交易团获悉,山西乐酷文化传媒有限公司系列动画片《叽哩与咕噜》上榜“中国国际服务贸易交易会服务示范案例”
2025-09-12 17:56:00
9月11日,抖音电商安全与信任中心发布专项治理“高价售卖低价值商品”的公告,持续打击不良商家利用信息差不当获利的违规行为
2025-09-12 17:57:00
四川简阳:这些暖心小事,藏着城市治理的大温度
消费日报网讯(记者 罗颖□胡禹)城市的温度,藏在每一次暖心的互动里。城市的治理效能,显在每一次高效的协同中。四川省简阳市智慧蓉城运行中心作为城市运行的“神经中枢”
2025-09-12 17:57:00
河北平乡:中小学生颂师恩
河北新闻网讯(李国军 )秋兰飘香,硕果盈枝。9月10日,第41个教师节,河北省平乡县各中小学学生怀着激动的心情,以不同的方式表达对老师的感恩之心
2025-09-12 18:18:00
9月12日,#有小学建议不让老人接送小孩#冲上热搜。网友说,学校这是“何不食肉糜”,老人们更知道安全的重要性,主要是没有办法
2025-09-12 18:25:00