• 我的订阅
  • 科技

DeepSeek,这条诞生在杭州的“鲸鱼” 这几天在全球科技圈、资本圈掀起滔天巨浪

类别:科技 发布时间:2025-01-28 07:53:00 来源:杭州网

金鳞耀岁 共启新程

DeepSeek,这条诞生在杭州的“鲸鱼” 这几天在全球科技圈、资本圈掀起滔天巨浪

梁文锋在总理座谈会上发言 新闻联播截图

DeepSeek,这条诞生在杭州的“鲸鱼” 这几天在全球科技圈、资本圈掀起滔天巨浪

昨天傍晚DeepSeek最新发布的乙巳新年春节AI贺词

一场名为DeepSeek(深度求索)的风暴,正在席卷全球。

昨天,中美两国的苹果应用商店同时被一条“鲸鱼”攻占。作为一款来自中国的AI应用,DeepSeek完成了对chatGPT的超越。

在资本市场,这条鲸鱼也正在掀起滔天巨浪。

大洋彼岸,龙年最后一个交易日,A股AI算力指数大跌3.94%,寒武纪股价跌幅一度超10%。截至昨晚11:00,英伟达、博通等算力相关公司的股价跌幅均超过11%。

自2023年底chatGPT横空出世,全球科技界的夜空被人工智能点亮以来,从未像现在这般聚集起一股“算力怀疑论”的厚重阴霾。

彻底释放它的,就是一个月来官宣两个开源大模型,被称为“来自东方神秘力量”的DeepSeek。他们的总部位于杭州,是“杭州四小龙”的代表,创始人梁文锋毕业于浙大,前不久刚被国务院总理李强接见。

中国的大模型已经追上美国了?

故事还得追溯到一个月前,1月23日,中国大模型创业团队DeepSeek官宣了新一代开源大模型DeepSeek-V3,部分性能与GPT-4o和Claude Sonnet 3.5等顶尖模型相近。

一个月后,DeepSeek-R1开源模型面世,在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1正式版。

整件事最为传奇的地方在于,DeepSeek-V3的训练成本不到竞争对手的十分之一。Deepseek-R1的训练成本虽然没有公布,但它的收费却只有OpenAI o1的三十分之一。

简单说,现阶段DeepSeek就是全球大模型“性价比”的代名词。这就不难理解,全球的科技爱好者这两天都在下载体验DeepSeek。在国外,已经出现“使用DeepSeek构建一切”“Goodbye chatGPT”这样的话题。

昨天,同在杭州,《黑神话:悟空》出品人、游戏科学创始人冯骥总结了DeepSeek六大特点:强大、便宜、开源、免费、联网、本土。他还说:DeepSeek,可能是个国运级别的科技成果。

听上去有点夸张,但类似的讨论已经在美国持续了一周时间。在参与媒体访谈时,谷歌前CEO埃里克·施密特改变了美国在AI方面保持了两到三年领先优势的看法。他表示,过去6个月,中国以一种非同寻常的方式迎头赶上,其中一个项目就是DeepSeek。

他们不是在复制,是在创新

当然,更多的是来自同行满满的敬意。英伟达高级研究科学家Jim Fan评价R1:“我们生活在这样一个时间线上,一家非美国公司正在维持OpenAI的原始使命——真正开放、前沿的研究,赋予所有人力量。这看似不合逻辑,但最有趣的结果往往最容易发生。”

这个不合逻辑在哪?在美国AI初创公司Perplexity首席执行官Aravind Srinivas看来,DeepSeek的开发显然也受制于高端芯片等硬件,但“需求是发明之母”,DeepSeek用变通的方式构建了高效的解决方案。

他说自己非常惊讶,“通常的认知是中国人擅长复制。如果我们停止发表研究论文,停止描述我们的基础设施架构细节,停止开源,他们将无法赶上……这并不是说他们在复制,而是在创新。”

那么,DeepSeek究竟用了什么魔法呢?

比如,他们对通用的模型推理步骤进行了调整。以往模型在提升推理能力时通常依赖于“监督微调”这个环节。这个环节可以简单类比为人类的填鸭式教育,就是让大模型反复做题,学习人类的推理方式。

而DeepSeek-R1在训练过程中直接跳过了这个环节,进入了“强化学习”阶段,探索大模型在没有任何监督数据的情况下,通过纯强化学习进行自我进化。他们要求大模型必须要把思考过程写出来,通过“奖励”引导这个“学生”找到最佳方案。

经历了无数次训练后,大模型这个学生迎来了“Aha moment”(顿悟时刻)。

这个“顿悟”外加其他工程上的优化,DeepSeek证明了疯狂堆积算力、数据的“大力出奇迹”不是通往AGI的唯一路径。

当优雅的算法能够降低对算力的依赖,目前全球的算力是否存在过剩,未来市场对算力的需求是否需要修正?这是近期动摇全球资本市场对科技企业的估值,出现动荡的根本。

最早的AI尝试用在了炒股上

在官方公众号上,DeepSeek对自己的介绍是,投身于探索AGI的本质,不做中庸的事,带着好奇心,用最长期的眼光去回答最大的问题。

在这次一鸣惊人前,很多人在国产的大模型江湖没听说过DeepSeek的名号。一定程度上缘于他们至今没有融过资,更别说接到任何一个巨头的“橄榄枝”。但这并不妨碍他们可能是“国内拥有最多高性能GPU的公司”。

这个底子,是他们做量化投资打下的。在轰炸AI圈之前,DeepSeek及背后的幻方量化是金融江湖成名已久的高手。

低调的创始人梁文锋是80后,出生在广东的一个五线城市,父亲是一名小学老师。他毕业于浙江大学,主修软件工程,人工智能方向。有同事评价梁文锋:完全不像一个老板,而更像一个极客。因为作为老板,他本人每天都在写代码、跑代码,学习能力惊人。

2016年,幻方量化首次上线运行AI策略。2018年,确立了要成为一家AI科技公司。2023年7月,梁文锋在杭州创立深度求索DeepSeek。

在团队配置上,DeepSeek只有139名研发人员,差不多是OpenAI的五分之一。其中,算法、推理框架、多模态等研发工程师以及深度学习方面的研究人员共有约70人。

梁文锋曾透露,DeepSeek并没有什么高深莫测的奇才,都是一些Top高校的应届毕业生,没毕业的博四、博五实习生,还有一些毕业才几年的年轻人,“V2模型没有海外回来的人,都是本土的。前50名顶尖人才可能不在中国,但也许我们能自己打造这样的人”。

无论是在技术还是人才上,梁文锋似乎坚定地看好中国走出自己的模式,从而扮演科技变革引领者的角色。

今年1月20日,也就是DeepSeek-R1发布的当天,他参加了总理座谈会。会上李强总理强调,“要以科技创新推动新旧动能转换,集中力量突破关键核心技术和前沿技术,加快推进科技成果产业化,努力培育更多经济新增长点”。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2025-01-28 17:45:05

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

一群“潜”入加拿大泳池的清洁机器人
...大小的泳池干干净净。今年以来,已经有4万多台带着“鲸鱼”标志的机器人“潜”入了欧美的私人泳池。“鲸鱼”的起点,就在杭州。2023年,时年23岁的陈骞创立了杭州部蓝科技创新有限
2025-07-15 07:06:00
“六小龙”何以扎堆出现?细数杭州的“金木水火土”
...温润之城能汇聚起八方创客、各路高手,掀起科技创新的巨浪。火——接续不息的“创新火种”回溯历史,杭州在别人犹豫时迈步,在别人彷徨时加速,一次次点燃、接续创新火种,让“星星之火”
2025-02-20 05:42:00
36氪独家 | ChatGPT巨浪:浪潮之上的AGI创业公司
...多,但还少有人知道那些更早入场的创业公司,站在这场巨浪的风口浪尖有什么样的思考、挣扎和决策。“ 我们意识到,ChatGPT和所有这几年‘昙花一现’的技术都不同。”ChatGP
2023-02-20 09:54:00
《赢在AI+》上海路演完美收官,“百亿资源包”按下AI应用“加速键”
...擎Cloudpick++等AI创新项目均获得了现场评委的肯定。上海鲸鱼机器人科技有限公司联合创始人、副总裁吕佩章介绍的编程机器人AI Module系列
2024-11-03 15:07:00
男子划船时被鲸鱼一口吞下又被吐出 其父亲拍下事发全程
...嘴从水下窜出,直接把男子连人带船吞入口中。可随后,鲸鱼潜入水中时又将男子从口中吐了出来,男子迅速返回水面游向了他的船。男子事后表示:“我以为它当时要把我吞掉”。报道称,这名男
2025-02-13 19:51:00
...,赖声川与女儿、孙女共同创作的第二个“床头故事”《鲸鱼图书馆》又要和小朋友们见面了。从2016年开始,赖声川带领上剧场的团队制作了《蓝马》《鲸鱼图书馆》两部亲子剧,这些作品都
2024-07-15 07:17:00
杭州的“海鲸群” 游进深海万亿级赛道
...玮玮指着设备舱内整齐排列的模块化载荷介绍,这台形似鲸鱼的潜航器,采用仿生流线设计,尾部水平舵与背鳍垂直舵构成三维机动系统,使其能在复杂洋流中保持稳定航态。海鲸身上搭载的多项荷
2025-06-04 08:04:00
浙江企业加速“出圈” 杭州领跑成最大赢家
...资600万美元,成为嘉兴首家纳斯达克上市企业。2月27日,杭州企业微巴士在纳斯达克上市,引发全球瞩目。年仅25岁的创始人兼CEO郑楠,成为亚洲最年轻的纳斯达克上市公司掌舵者。
2025-04-20 08:29:00
来自万物生长大会的追问——资本为何看好中国?
杭州日报讯 第九届万物生长大会,4月23日-25日在杭州举行。会前,各路资本云集杭州,大家都在探讨未来的投资机会在哪里?在昨天举行的万物生长大会分论坛、2025长期资本大会上,“
2025-04-24 07:04:00
更多关于科技的资讯:
投资赋“筑” | 粤黔协作 贵州触摸屏领军企业走向世界
粤黔协作正持续赋能贵州产业高质量发展。自2021年两省建立新一轮东西部协作关系以来,“广东总部+贵州基地”“广东研发+贵州制造”等合作模式不断深化落地
2025-09-17 20:58:00
智造世界 创造美好丨破解“池州芯”检测痛点 池州平天湖半导体产业研究院加速建设
大皖新闻讯 近日,安徽省人大代表、安徽钜芯半导体科技有限公司董事长曹孙根透露,作为池州半导体产业的“共性服务平台”,池州市平天湖半导体产业研究院今年7月已正式取得运营资质
2025-09-17 13:22:00
凭借技术突破、链式崛起和全球布局,泉州洛江推动机械装备产业链实现年产值超百亿元一个百亿产业集群的三级跃迁东南网9月17日讯(福建日报记者 黄琼芬 何金 通讯员 叶金玉)近日
2025-09-17 13:24:00
从AI开发提效到游戏全球出海,腾讯云升级全新游戏行业全生命周期方案
9月16日,2025腾讯全球数字生态大会在深圳国际会展中心举办。游戏专场上,腾讯云正式发布全新升级的游戏全生命周期解决方案
2025-09-17 13:54:00
3・15金秋购物节启幕!海尔智家以“ 三好” 助力安心焕新
为大力提振消费,全方位扩大国内需求,扎实推进优化消费环境三年行动,共筑满意消费,增强人民群众在消费生活中的获得感、幸福感
2025-09-17 11:40:00
鲁网9月17日讯万物互联,信息化浪潮奔涌。在数字化转型的过程中,工业互联网平台发挥着中枢神经般的重要作用。企业生产过程的数字化管理
2025-09-17 10:40:00
王涵为了准确识别由AI生成的内容并防止其被滥用,不少人建议用AI对抗AI,“AI溯源”技术应运而生。OpenAI宣布将推出一款工具
2025-09-17 10:52:00
360集团董事长周鸿祎:“超级员工” 是这样炼成的
周鸿祎(本报记者 林铭鸿 摄)厦门网讯 (厦门日报记者 刘艳)大模型相当于头脑,能说会道,能思考、能规划、能推理,但是没有手跟脚
2025-09-17 08:35:00
从高速增长到高质量发展:AI智习室的行业变革与挑战
从高速增长到高质量发展:AI智习室的行业变革与挑战在技术赋能教育的大背景下,AI智习室正成为连接传统教育与未来教育的重要桥梁
2025-09-17 09:03:00
烟台联通圆满完成2025莱州半程马拉松通信保障工作
9月14日,2025莱州半程马拉松正式鸣枪开跑,近5000名来自全国各地的跑步爱好者齐聚莱州,以奔跑感受城市风貌,用激情点燃赛事氛围
2025-09-17 08:06:00
手握101项专利,曜灵时代以创新引擎驱动临沂新能源产业升级
齐鲁晚报·齐鲁壹点 高松作为临沂新能源产业链的代表企业,曜灵时代积极践行绿色发展理念,不断创新和突破科学技术。目前,集团下设多个核心全资子公司
2025-09-17 08:08:00
南报网讯(记者孙琳通讯员焦娇李妍妍)9月15日,全国首个市级场景公共服务平台——“南京场景服务平台”正式上线。记者获悉
2025-09-17 07:45:00
□南京日报/紫金山新闻记者张安琪【实验室档案】新型显示与视觉感知石城实验室,由中央广播电视总台、南京市科技局、东南大学和鼓楼区于2022年8月开始合作共建
2025-09-17 07:45:00
南报网讯(记者曹丽珍)当《哈利·波特》系列电影中的魔法道具“隐身斗篷”有可能从银幕走向现实,如何为这种前沿科研保驾护航
2025-09-17 07:46:00
□南京日报/紫金山新闻记者张甜甜9月正值开学季,各大高校相继迎来新生报到。运满满司机申英良将刚刚收到的“云程奖学金”交到小儿子申宝凯手中——今年
2025-09-17 07:46:00