• 我的订阅
  • 社会

DeepSeek 的“修炼”之路,还要闯几关?

类别:社会 发布时间:2025-02-28 10:48:00 来源:缘之心

以小博大、逆袭吊打,曾是修仙爽文、微短剧里让人上头却略显荒诞的剧情,而今,DeepSeek(深度求索)让它在真实世界里发生了。

火爆全球超过一个月,DeepSeek掀起的风暴还在持续,随之而来的还有一波三折的戏码,同行的围剿、跨界的争议……正如影视作品中每一位“爽文大女主”升级打怪时所面对的关卡一样。

誉满天下,谤亦随之,DeepSeek的“修炼”之路,还要闯几关?

“爽文大女主”出三招

悄悄推出两款模型,即引发硅谷与华尔街的剧烈震荡,让OpenAI接连推出竞争产品并免费开放搜索,谷歌一股脑儿发布“满血版全家桶”,国内大厂的旗舰模型也开始免费开放。

深有“天上掉馅饼”之感的万千普通用户,倒是想给DeepSeek送锦旗了,不过,大家也想知道,凭一己之力就把曾经高不可攀的全球最顶级大模型的价格打下来了,究竟用了什么招?

——“乱”拳打伤老师傅。从架构到工程,从算法到部署,DeepSeek悟透的是“四两拨千斤”的中国武术古训,不理会“参数规模决定论”,反倒是秀出了数据质量优化与算法架构创新的乘数效应,在看似不可能的壁垒中突围。

——拆掉半壁卫城墙。一般来说,大模型开发者用了英伟达的GPU,也就得用他家的运算平台CUDA搞研发。毕竟CUDA已经封装好一些函数,后来者使用时直接调用接口搞加工就行,这样的低门槛当然方便资源有限的开发者,但是,这也意味着深度研发执行效率的折扣。

绕过CUDA,直接基于GPU的驱动函数开发,行不行?DeepSeek给出了肯定的答案。凭借独到软件算法优化,拆掉英伟达“卫城墙”,也就是不必仰赖其CUDA生态行事,DeepSeek走出了一条中国AI技术创新的新路子。

——小力也能出奇迹。自从OpenAI的ChatGPT发布以来,微软、谷歌、Meta等科技巨头一直在增加与人工智能相关的算力支出。“军备竞赛”式的投入,也催动了美国AI芯片股价一路攀升。

就当行业仍困囿于“算力军备竞赛”的思维定式之际,DeepSeek凭借区区558万美元训练成本就让V3模型达到了GPT-4o九成功力,R1模型更实现以纯强化学习突破推理能力边界,向世界证明,AI大模型的革命,不一定要靠算力堆出来。

是幻觉还是“真香”

DeepSeek的小而精、强且美,是炒作出来的“幻觉”,还是厚积薄发而得的“真香”?

自从在AI江湖中亮出名号,DeepSeek就不满足于追随者,这可以从其开发的一系列原创技术获得证明。MLA、GRPO、R1-Zero……门外汉对着这些字母大概会如坠五里雾中,但是,这些技术合力激发的“聚变”,恐怕是DeepSeek获得140多个国家用户认可的根本原因。

北京白领小游说,DeepSeek的回答不像GPT的回答那么干巴巴,像个只会写材料的书呆子,按部就班安排任务步骤,而像个鬼马精灵,只要你说明目的,她就能拆解和揣摩你的弦外之音、思考怎么实现你想要的:“甚至你可以问她一些你都没有答案的大问题。”

当然,DeepSeek依然在蓬勃的成长期。以最新的DeepSeek-R1为例,虽然其突破鼓舞人心,但学术界用起来还不免有点头疼——面对悠远文明时间中的复杂因果,现代学术论述的复杂规范,DeepSeek的回答还不免左支右绌。

而且,DeepSeek暂时还不谙图像处理,回应大规模用户需求也有“体力不支”的情况,这些困难都意味着,DeepSeek的修炼,“高原期”刚刚开始。

如何学习文明的智慧

技术革命的浪潮里,没有永恒的王者,只有不断的超越。具体到AI领域,大家的共识更是:充满不确定性、一直充满热度、但不乏过度反应。

无休止的波动,折射出的,其实是科技进化的深层图像——人工智能,就好像之前种种引发文明革命的重大科技进展一样,前进路线并非笔直的线性轨迹,而是永恒的螺旋。

谁来驱动这螺旋?不论DeepSeek参演的是爽剧还是正剧,角色与剧本背后的导演还是人类自己。

如果说AI是普罗米修斯之火,那么人类文明就是在自我颠覆中奔流不息、江声浩荡的赫拉克利特之河。我们最珍贵的不是回答和解决已有问题的能力,而是发现新问题的智慧、定义新问题的勇气——这更需要创造性与想象力。

DeepSeek式创新的下一次突破,其通关密码,就生成于回向文明深处寻求思考变革的努力中。以文明赋能人工智能,人工智能的“飞升”时刻,也许就会到来。

原标题《DeepSeek的修炼之路》

半月谈记者:张漫子

(半月谈微信公众号)【编辑:张子怡】

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2025-02-28 14:45:01

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

首届中国大模型大会在北京举行
...。主办方供图人民网北京6月20日电 (焦磊)大模型作为人工智能领域的技术新高地,正加速赋能千行百业。6月18日至19日,以“中国大模型之路”为主题的首届中国大模型大会(CLM
2024-06-20 17:17:00
...是来自临平的地卫二空间技术(杭州)有限公司所展示的人工智能卫星“地卫智能应急一号”首发产品,该卫星能在太空中利用人工智能算力进行在轨数据分析和处理,极大提升了卫星数据的使用效
2023-11-27 06:24:00
《三星堆:未来启示录》AIGC赋能古文明科幻短剧集
由博纳影业AIGMS制作中心,联合抖音、即梦AI生成式人工智能创作平台,出品并制作的AI生成式连续性叙事科幻短剧《三星堆:未来启示录》第一季,揭开一段跨越时空的古文明探险旅程,开
2024-06-17 17:53:00
李彦宏:AI原生应用比大模型数量更重要
...》的演讲。大模型是当下全球科技创新的焦点,也是全球人工智能竞赛的主战场。李彦宏认为,“新的国际竞争战略关键点,不是一个国家有多少个大模型,而是你的大模型上有多少原生的AI应用
2023-06-26 19:20:00
2023全球数字经济大会人工智能高峰论坛: 探讨北京大模型的发展之路
2023全球数字经济大会人工智能高峰论坛于7月2日在北京中关村国家自主创新示范区会议中心举行。本次论坛以“智能涌现,重塑未来”为主题,旨在探讨通用人工智能大模型发展等热点议题,助
2023-07-04 10:08:00
B站AI课几秒出总结,划词就给解释,这个「AI学习搭子」真香
...」功能时,大家如获至宝。以李宏毅最近开设的《生成式人工智能导论》这门课为例,在点开之前,我们还担心,这门课会不会要求很高。结果,看了豆包总结的第一讲概要,这种顾虑就打消了。为
2024-07-27 09:29:00
...世界,数字技术正全面融入人类社会的各领域和全过程,人工智能已然成为人类文明进步的一个重要标志。与此同时,数字技术如果失去了规范和约束,就可能成为“潘多拉魔盒”,给现实社会带来
2023-06-26 20:58:00
全球人工智能发展,可能还会走上核武竞争的老路
“如何回应人工智能带来的挑战?我们可以从中华文明和中国式现代化中汲取智慧。”“通用人工智能会催生重大的技术和产业创新,可能会导致行业生态的重新洗牌。”在东方卫视8月7日播出的《这
2023-08-14 10:05:00
...人周鸿祎也针对这一话题发表演讲。周鸿祎表示,过去的人工智能是弱人工智能,在此基础上打造的智能硬件不具有真正的智能。大模型出现后,计算机第一次真正的理解这个世界,并能够赋予AI
2023-06-02 01:09:00
更多关于社会的资讯:
66岁的卢女士,20多年前左耳就“聋”了,当地医生说是慢性胆脂瘤型中耳炎反复发病导致的。不仅如此,卢女士的左耳还反复疼痛
2025-12-13 07:05:00
随着流感高发期的到来,发热、咳嗽、咽痛等症状人群显著增多。排队耗时漫长、交叉感染风险增加,成为许多患者就医时的困扰。杭州多家省市级医院纷纷推出便民举措
2025-12-13 07:36:00
当前流感活动上升明显,流感疫苗接种迎来高峰。近日,在上城区采荷街道社区卫生服务中心,接种市民明显增多,“家庭组团”前来接种的现象较突出
2025-12-13 07:36:00
12日,“浙江女性”英文网页上线,这是浙江省妇联继“浙里媒丽圈”后,向世界讲好浙里她故事的又一新平台,也是全国首个上线的地方妇联官方英文网站
2025-12-13 07:36:00
12日,“群星闪耀时 嘉兴醉江南——全国媒体名家大V嘉兴行”活动启幕。由人民日报、新华社、浙江日报、解放日报等中央和省市主流媒体记者
2025-12-13 07:36:00
吉网调查|高层楼道“堵堵堵”,“生命通道”如何畅通?
“我们家的楼道快被杂物堵死了,万一发生火灾,后果不堪设想!”近日,家住长春市二道区青阳华府高层的居民王先生向中国吉林网反映
2025-12-13 07:24:00
当今世界,文化软实力已成为国家综合实力的重要组成部分。“文化兴国运兴,文化强民族强。没有高度的文化自信,没有文化的繁荣兴盛
2025-12-12 16:20:00
在故事中听见医学回响 上海医生侯英勇分享从医之路
近日,中山医院女医师协会“品味云端·书香乐韵·叙事医学”特别活动,在上海朵云书院启幕。第一篇章“叙事的温度・在故事中听见医学的回响”
2025-12-12 16:22:00
当地政府回应“村支书卖小米被投诉” :已关注此事,正在调查;当事人多平台账号视频已清空
大皖新闻讯 近日,自称山东威海荣成市一村支书冯玉宽网上卖谷物小米,被小米公司法务“关联雷氏营销”投诉下架视频一事引发热议
2025-12-12 16:39:00
莒南二小开展“国家公祭日”主题班会活动
鲁网12月12日讯为传承和弘扬以爱国主义为核心的伟大民族精神,在第十二个国家公祭日来临之际,近日,莒南县第二小学组织各班级开展“国家公祭日”主题班会活动
2025-12-12 16:39:00
“一起遇见威海”2025年网络话题挑战赛颁奖活动举行
鲁网12月12日讯12月11日,“一起遇见威海”2025年网络话题挑战赛颁奖活动在威海市群众艺术馆举行。活动以“见热度”“见共鸣”“见温度”“见影响”“见未来”“见浪潮”六个篇章串联
2025-12-12 16:39:00
邯郸成安县老人上网遭多个平台“幽灵扣款” 银行成功追回
近日,邯郸市成安县一位老人名下账户莫名其妙被多个网络平台扣款,建行成安支行员工根据转账记录等相关证据,凭借专业知识和丰富经验
2025-12-12 16:40:00
大皖新闻讯 人工智能技术的快速发展,特别是以Deepseek为代表的国产大模型的广泛使用,已开始悄然改变我们的工作、生活
2025-12-12 16:42:00
暖心致谢!遵医附院神经外科二病区为患者拆除“颅内隐形炸弹”
多彩贵州网讯 “太感谢你们了!是你们延续了我母亲的生命!”12月12日,遵义医科大学附属医院神经外科二病区的医生办公室内暖意融融
2025-12-12 16:58:00
文化为媒聚合力,金融赋能启新程。12月10日,邮储银行张家港市支行应邀参与张家港市文化艺术业商会“志者恒进——迎新年文化雅集活动”
2025-12-12 17:11:00