• 我的订阅
  • 科技

DeepSeek,这条诞生在杭州的“鲸鱼” 这几天在全球科技圈、资本圈掀起滔天巨浪

类别:科技 发布时间:2025-01-28 07:53:00 来源:杭州网

金鳞耀岁 共启新程

DeepSeek,这条诞生在杭州的“鲸鱼” 这几天在全球科技圈、资本圈掀起滔天巨浪

梁文锋在总理座谈会上发言 新闻联播截图

DeepSeek,这条诞生在杭州的“鲸鱼” 这几天在全球科技圈、资本圈掀起滔天巨浪

昨天傍晚DeepSeek最新发布的乙巳新年春节AI贺词

一场名为DeepSeek(深度求索)的风暴,正在席卷全球。

昨天,中美两国的苹果应用商店同时被一条“鲸鱼”攻占。作为一款来自中国的AI应用,DeepSeek完成了对chatGPT的超越。

在资本市场,这条鲸鱼也正在掀起滔天巨浪。

大洋彼岸,龙年最后一个交易日,A股AI算力指数大跌3.94%,寒武纪股价跌幅一度超10%。截至昨晚11:00,英伟达、博通等算力相关公司的股价跌幅均超过11%。

自2023年底chatGPT横空出世,全球科技界的夜空被人工智能点亮以来,从未像现在这般聚集起一股“算力怀疑论”的厚重阴霾。

彻底释放它的,就是一个月来官宣两个开源大模型,被称为“来自东方神秘力量”的DeepSeek。他们的总部位于杭州,是“杭州四小龙”的代表,创始人梁文锋毕业于浙大,前不久刚被国务院总理李强接见。

中国的大模型已经追上美国了?

故事还得追溯到一个月前,1月23日,中国大模型创业团队DeepSeek官宣了新一代开源大模型DeepSeek-V3,部分性能与GPT-4o和Claude Sonnet 3.5等顶尖模型相近。

一个月后,DeepSeek-R1开源模型面世,在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1正式版。

整件事最为传奇的地方在于,DeepSeek-V3的训练成本不到竞争对手的十分之一。Deepseek-R1的训练成本虽然没有公布,但它的收费却只有OpenAI o1的三十分之一。

简单说,现阶段DeepSeek就是全球大模型“性价比”的代名词。这就不难理解,全球的科技爱好者这两天都在下载体验DeepSeek。在国外,已经出现“使用DeepSeek构建一切”“Goodbye chatGPT”这样的话题。

昨天,同在杭州,《黑神话:悟空》出品人、游戏科学创始人冯骥总结了DeepSeek六大特点:强大、便宜、开源、免费、联网、本土。他还说:DeepSeek,可能是个国运级别的科技成果。

听上去有点夸张,但类似的讨论已经在美国持续了一周时间。在参与媒体访谈时,谷歌前CEO埃里克·施密特改变了美国在AI方面保持了两到三年领先优势的看法。他表示,过去6个月,中国以一种非同寻常的方式迎头赶上,其中一个项目就是DeepSeek。

他们不是在复制,是在创新

当然,更多的是来自同行满满的敬意。英伟达高级研究科学家Jim Fan评价R1:“我们生活在这样一个时间线上,一家非美国公司正在维持OpenAI的原始使命——真正开放、前沿的研究,赋予所有人力量。这看似不合逻辑,但最有趣的结果往往最容易发生。”

这个不合逻辑在哪?在美国AI初创公司Perplexity首席执行官Aravind Srinivas看来,DeepSeek的开发显然也受制于高端芯片等硬件,但“需求是发明之母”,DeepSeek用变通的方式构建了高效的解决方案。

他说自己非常惊讶,“通常的认知是中国人擅长复制。如果我们停止发表研究论文,停止描述我们的基础设施架构细节,停止开源,他们将无法赶上……这并不是说他们在复制,而是在创新。”

那么,DeepSeek究竟用了什么魔法呢?

比如,他们对通用的模型推理步骤进行了调整。以往模型在提升推理能力时通常依赖于“监督微调”这个环节。这个环节可以简单类比为人类的填鸭式教育,就是让大模型反复做题,学习人类的推理方式。

而DeepSeek-R1在训练过程中直接跳过了这个环节,进入了“强化学习”阶段,探索大模型在没有任何监督数据的情况下,通过纯强化学习进行自我进化。他们要求大模型必须要把思考过程写出来,通过“奖励”引导这个“学生”找到最佳方案。

经历了无数次训练后,大模型这个学生迎来了“Aha moment”(顿悟时刻)。

这个“顿悟”外加其他工程上的优化,DeepSeek证明了疯狂堆积算力、数据的“大力出奇迹”不是通往AGI的唯一路径。

当优雅的算法能够降低对算力的依赖,目前全球的算力是否存在过剩,未来市场对算力的需求是否需要修正?这是近期动摇全球资本市场对科技企业的估值,出现动荡的根本。

最早的AI尝试用在了炒股上

在官方公众号上,DeepSeek对自己的介绍是,投身于探索AGI的本质,不做中庸的事,带着好奇心,用最长期的眼光去回答最大的问题。

在这次一鸣惊人前,很多人在国产的大模型江湖没听说过DeepSeek的名号。一定程度上缘于他们至今没有融过资,更别说接到任何一个巨头的“橄榄枝”。但这并不妨碍他们可能是“国内拥有最多高性能GPU的公司”。

这个底子,是他们做量化投资打下的。在轰炸AI圈之前,DeepSeek及背后的幻方量化是金融江湖成名已久的高手。

低调的创始人梁文锋是80后,出生在广东的一个五线城市,父亲是一名小学老师。他毕业于浙江大学,主修软件工程,人工智能方向。有同事评价梁文锋:完全不像一个老板,而更像一个极客。因为作为老板,他本人每天都在写代码、跑代码,学习能力惊人。

2016年,幻方量化首次上线运行AI策略。2018年,确立了要成为一家AI科技公司。2023年7月,梁文锋在杭州创立深度求索DeepSeek。

在团队配置上,DeepSeek只有139名研发人员,差不多是OpenAI的五分之一。其中,算法、推理框架、多模态等研发工程师以及深度学习方面的研究人员共有约70人。

梁文锋曾透露,DeepSeek并没有什么高深莫测的奇才,都是一些Top高校的应届毕业生,没毕业的博四、博五实习生,还有一些毕业才几年的年轻人,“V2模型没有海外回来的人,都是本土的。前50名顶尖人才可能不在中国,但也许我们能自己打造这样的人”。

无论是在技术还是人才上,梁文锋似乎坚定地看好中国走出自己的模式,从而扮演科技变革引领者的角色。

今年1月20日,也就是DeepSeek-R1发布的当天,他参加了总理座谈会。会上李强总理强调,“要以科技创新推动新旧动能转换,集中力量突破关键核心技术和前沿技术,加快推进科技成果产业化,努力培育更多经济新增长点”。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2025-01-28 17:45:05

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

一群“潜”入加拿大泳池的清洁机器人
...大小的泳池干干净净。今年以来,已经有4万多台带着“鲸鱼”标志的机器人“潜”入了欧美的私人泳池。“鲸鱼”的起点,就在杭州。2023年,时年23岁的陈骞创立了杭州部蓝科技创新有限
2025-07-15 07:06:00
“六小龙”何以扎堆出现?细数杭州的“金木水火土”
...温润之城能汇聚起八方创客、各路高手,掀起科技创新的巨浪。火——接续不息的“创新火种”回溯历史,杭州在别人犹豫时迈步,在别人彷徨时加速,一次次点燃、接续创新火种,让“星星之火”
2025-02-20 05:42:00
36氪独家 | ChatGPT巨浪:浪潮之上的AGI创业公司
...多,但还少有人知道那些更早入场的创业公司,站在这场巨浪的风口浪尖有什么样的思考、挣扎和决策。“ 我们意识到,ChatGPT和所有这几年‘昙花一现’的技术都不同。”ChatGP
2023-02-20 09:54:00
《赢在AI+》上海路演完美收官,“百亿资源包”按下AI应用“加速键”
...擎Cloudpick++等AI创新项目均获得了现场评委的肯定。上海鲸鱼机器人科技有限公司联合创始人、副总裁吕佩章介绍的编程机器人AI Module系列
2024-11-03 15:07:00
...探寻南京高水平对外开放实践数实融合,掀起创新协同“巨浪”□南京日报/紫金山新闻记者江芬芬9月19日至20日,由中宣部和省委宣传部组织的2025年“活力中国调研行”江苏主题采访
2025-09-22 07:40:00
男子划船时被鲸鱼一口吞下又被吐出 其父亲拍下事发全程
...嘴从水下窜出,直接把男子连人带船吞入口中。可随后,鲸鱼潜入水中时又将男子从口中吐了出来,男子迅速返回水面游向了他的船。男子事后表示:“我以为它当时要把我吞掉”。报道称,这名男
2025-02-13 19:51:00
...,赖声川与女儿、孙女共同创作的第二个“床头故事”《鲸鱼图书馆》又要和小朋友们见面了。从2016年开始,赖声川带领上剧场的团队制作了《蓝马》《鲸鱼图书馆》两部亲子剧,这些作品都
2024-07-15 07:17:00
杭州的“海鲸群” 游进深海万亿级赛道
...玮玮指着设备舱内整齐排列的模块化载荷介绍,这台形似鲸鱼的潜航器,采用仿生流线设计,尾部水平舵与背鳍垂直舵构成三维机动系统,使其能在复杂洋流中保持稳定航态。海鲸身上搭载的多项荷
2025-06-04 08:04:00
浙江企业加速“出圈” 杭州领跑成最大赢家
...资600万美元,成为嘉兴首家纳斯达克上市企业。2月27日,杭州企业微巴士在纳斯达克上市,引发全球瞩目。年仅25岁的创始人兼CEO郑楠,成为亚洲最年轻的纳斯达克上市公司掌舵者。
2025-04-20 08:29:00
更多关于科技的资讯:
建设银行聊城分行始终践行国家普惠金融政策,坚守服务实体经济的初心、将支持小微企业发展放在优先位置,精准聚焦企业“短、频
2025-10-18 19:58:00
通讯员 程瑶近日,在泰安市大数据局、泰安市财政局、国家金融监督管理总局泰安监管分局、泰安市直多部门举办的2025年“数据要素×”大赛山东分赛泰安市选拔赛中
2025-10-18 19:58:00
通讯员 王靓婧随着AI技术与柜台业务深度融合,建行的AI助手正以“智能搭档”的角色,为柜员减负、提效、赋能,重新定义线下金融服务的专业与温度
2025-10-18 19:23:00
探访南昌红谷滩商业新活力:首店经济亮眼,TOD模式引潮
大皖新闻讯 2025世界VR产业大会召开在即,南昌市红谷滩区委宣传部以“活力红谷滩 智启新未来”为主题组织媒体行活动。媒体团深入辖区标杆商业体
2025-10-18 19:18:00
Kiwa为“腾越电子”颁发MID认证证书,叩响欧盟市场新篇章
国际权威检测、检验及认证(TIC)服务商Kiwa,于不久前正式向连云港腾越电子科技有限公司(全文简称为“腾越电子”)颁发欧盟CE认证MID证书
2025-10-18 18:44:00
南报网讯(通讯员胡晓靓记者夏思宇)走进南京绿叶制药有限公司制冷站,冷水机组、冷冻水泵、冷却水泵、冷却塔等设备稳定运转,维持药品生产GMP车间的恒温恒湿环境
2025-10-17 08:13:00
聚焦2025中国国际数字经济博览会•现场|打卡数字展馆 体验未来生活
10月16日,2025中国国际数字经济博览会展区工作人员在调试机器人。 河北日报记者 史晟全摄借助VR设备沉浸在古城往事中
2025-10-17 08:23:00
我从事科技研发工作,出生在一个三代从商的家庭。我的祖父是一名民营企业家,在枣强县这片土地上开启了玻璃钢产业创业之路;我的父亲骑着一辆摩托车闯荡天津
2025-10-17 09:11:00
博物馆“抢票”成第一关,中轴线打卡、汉服妆造让历史游玩出沉浸新花样……音乐节、演唱会与国际顶级体育赛事一票难求,“为一场演出赴一座城”成为常态
2025-10-17 09:15:00
新闻纵深·县域特色产业新力量|借力京津,机器人产业双链融合
阅读提示唐山市高新技术产业开发区在机器人新赛道上频频发力,已形成以工业机器人为引领、特种机器人为亮点、服务机器人为特色
2025-10-17 09:19:00
旭客民宿出租车广告上线,金华房东的“生意牌面”正在刷新
旭客民宿出租车广告上线,金华房东的“生意牌面”正在刷新最近在金华街头,不少人注意到一组频繁穿梭的出租车广告:“住旭客民宿
2025-10-17 09:25:00
AI EMPOWERS ALL丨神州泰岳亮相中国移动全球合作伙伴大会
碳硅共生,合创AI+时代——第13届中国移动全球合作伙伴大会于今日在广州保利世贸博览馆盛大启幕。神州泰岳作为中国移动长期重要合作伙伴
2025-10-17 09:25:00
内容觉醒·生态共创 | 2025瑞派短视频大赛职人组培训圆满落幕
金秋时节,硕果盈枝。由瑞派股份市场营销中心倾力打造的“2025年度瑞派短视频大赛职人专属赛道培训”在热烈氛围中圆满收官
2025-10-17 09:55:00
市场销售疲软,高档卷烟销售增速放缓,中低档卷烟却因消费需求旺盛出现供应紧张的问题,这是当前卷烟销售工作面临的瓶颈。受计划经济体制影响
2025-10-17 10:02:00
浪潮科技三款平台产品或升级认可
近日,山东省工业和信息化厅公布了拟入选第九批山东省首版次高端软件产品公示名单。浪潮科技研发的“焱宇行业大模型服务平台 V1
2025-10-17 10:03:00