• 我的订阅
  • 社会

同时登顶中美下载排行榜,DeepSeek凭啥超越GPT?看它自己怎么回答

类别:社会 发布时间:2025-01-27 23:15:00 来源:杭州网

潮新闻讯 辞旧迎新之际,如旋风般席卷全球AI圈的浙产AI大模型DeepSeek,继续创造历史。

同时登顶中美下载排行榜,DeepSeek凭啥超越GPT?看它自己怎么回答

图源:苹果美国区应用商店

1月27日,DeepSeek应用登顶苹果美国地区应用商店免费App下载排行榜,力压此前霸榜的OpenAI的ChatGPT,而排在第三名的是Meta旗下的Threads。

同日,苹果中国区应用商店免费榜显示,DeepSeek成为中国区第一。

同时登顶中美下载排行榜,DeepSeek凭啥超越GPT?看它自己怎么回答

图源:苹果中国区应用商店

作为“神秘东方力量”的组成部分、“杭州科技六小龙”之一,国产大模型公司深度求索(DeepSeek)被认为是大模型行业的最大“黑马”。2024年底,其以极低的算力(仅为同行的1/11)和GPU芯片数量(2000个)训练出了性能超越GPT-4o的大模型DeepSeek-V3,总训练成本仅557.6万美元(GPT-4约为7800万美元),被誉为“AI界的拼多多”。

同时登顶中美下载排行榜,DeepSeek凭啥超越GPT?看它自己怎么回答

图源:DeepSeek官网

去年12月DeepSeek-V3发布后,轰动世界AI圈。不到一个月之后,今年1月20日,DeepSeek正式开源R1推理模型。

据DeepSeek介绍,其最新发布的模型DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1正式版。

低成本实现高性能模型研发,对用户来说的体验感也立竿见影——它功能强大,但却免费使用,并且DeepSeek还将代码面向开发者进行了开源。

据了解,DeepSeek R1没有使用业内普遍使用的监督微调(SFT)训练范式,而是直接通过强化学习让模型自主进化出复杂的推理能力,包括反思和长链思考等能力。这种方法不仅提高了训练效率,还减少了对昂贵计算资源的依赖。

1月24日,一条发布在teamblind平台上的帖子疯传。一名Meta员工称,现在Meta内部因为DeepSeek的模型,已进入恐慌模式。

这位Meta员工写道:“一切源于DeepSeek-V3的出现,它在基准测试中已经让Llama4相形见绌。更让人难堪的是,一家‘仅用550万美元训练预算的中国公司’就做到了这一点。工程师们正在争分夺秒地分析DeepSeek,试图复制其中的一切可能技术……当部门里一个高管的薪资就超过训练整个DeepSeek V3的成本,而且这样的高管还有数十位,他们该如何向高层交代?”

潮新闻记者在手机上下载了R1免费版本的DeepSeek应用,尝试着让它写一副蛇年春联,其中要包括“龙”与“蛇”。大约两三秒就给出了结果,有对仗的上下联和横批,还写了一段文字来解读这幅对联的寓意,十分周全。

同时登顶中美下载排行榜,DeepSeek凭啥超越GPT?看它自己怎么回答

同时,记者增加难度,让它模仿贾谊的《过秦论》写一下隋朝,以《过隋论》为标题。不到一分钟,它就写了洋洋洒洒一大篇,按时间顺序,从隋文帝杨坚的开皇之治到隋炀帝杨广的倒行逆施导致隋朝二世而亡都写到了,条理清晰,观点鲜明。

同时登顶中美下载排行榜,DeepSeek凭啥超越GPT?看它自己怎么回答

最后,记者问它“为什么能够在美国苹果免费应用下载榜上超越ChatGPT”,它给出的答案就有点泛泛而谈了,给人一种“车轱辘话”的感觉。

同时登顶中美下载排行榜,DeepSeek凭啥超越GPT?看它自己怎么回答

1月26日,游戏科学创始人、CEO,《黑神话:悟空》制作人冯骥在微博上评价DeepSeek:可能是个国运级别的科技成果。

冯骥表示:“希望DeepSeek R1会让你对当前最先进的AI祛魅,让AI逐渐变成你生活中的水和电。太幸运了!太开心了!这样震撼的突破,来自一个纯粹的中国公司。知识与信息平权,至此又往前迈出了坚实的一步。”

同时登顶中美下载排行榜,DeepSeek凭啥超越GPT?看它自己怎么回答

图源:冯骥微博账号

值得一提的是,1月20日,深度求索的创始人梁文锋参加了国务院总理李强主持召开的专家、企业家和教科文卫体等领域代表座谈会。

据东方网报道,梁文锋本科、研究生毕业于浙江大学,拥有信息与电子工程学系本科和硕士学位。2008年起,他开始带领团队使用机器学习等技术探索全自动量化交易。2023年7月,DeepSeek正式成立,进军通用人工智能领域,至今从未对外融资。

DeepSeek团队规模不大,不到 140 人,但 “人才密度” 极高,成员多是来自清华、北大、北航等顶尖高校的应届博士毕业生、在读生以及硕士生。值得一提的是,团队没有“海归”,完全本土人才。

同时登顶中美下载排行榜,DeepSeek凭啥超越GPT?看它自己怎么回答

左一为梁文锋。图源:央视新闻截图

梁文锋秉持“看能力,不看经验”的理念,“选人的标准一直都是热爱和好奇心”,这吸引了大量年轻高潜人才,让众多 35 岁以下、工作经验不超五年的年轻人有充分的施展才华的舞台。

在团队管理上,梁文锋采用扁平化管理,淡化职级,鼓励自由讨论和创新,成员依兴趣选择研究方向并自由组队。当一个有潜力的构想出现时,公司会自上而下调配资源。而且,成员对资源和人员的调动不设上限,不存在层级和跨部门的限制,只要有想法,随时可以灵活调用。

梁文锋观点:

“我们创新缺的肯定不是资本,而是缺乏信心以及不知道怎么组织高密度的人才实现有效的创新。”

“对顶级人才吸引最大的,肯定是去解决世界上最难的问题。”

“创新不完全是商业驱动的,还需要好奇心和创造欲。”

“开源更像一个文化行为,而非商业行为。给予其实是一种额外的荣誉。一个公司这么做也会有文化的吸引力。”

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2025-01-28 05:45:03

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

DeepSeek创始人老家成热门打卡地:家长带着孩子拍照打卡
...eek一度登顶苹果中国地区和美国地区应用商店免费APP下载排行榜,甚至被海外称为“来自东方的神秘力量”。【本文结束】如需转载请务必注明出处:快科技责任编辑:若风文章内容举报
2025-02-01 23:09:00
DeepSeek,这条诞生在杭州的“鲸鱼” 这几天在全球科技圈、资本圈掀起滔天巨浪
...名为DeepSeek(深度求索)的风暴,正在席卷全球。昨天,中美两国的苹果应用商店同时被一条“鲸鱼”攻占。作为一款来自中国的AI应用
2025-01-28 07:53:00
腾讯、阿里都碰壁!梁文锋拒绝投资:不想用DeepSeek赚快钱
...司Andreessen Horowitz(a16z)发布的最新生成式AI消费级应用排行榜。DeepSeek自2025年1月20日正式上线以来
2025-03-11 17:49:00
...约束——它保留了HC的表达能力(可学习的连接权重),同时通过数学性质保证了稳定性(加权平均不会爆炸)。在自由和约束之间找平衡,这个思路可能在很多领域都适用。这也解释了Deep
2026-01-03 08:31:00
DeepSeek发布最新NSA技术论文!创始人梁文锋参与引人注目
...于NSA(即Natively Sparse Attention,原生稀疏注意力)。与此同时,在论文署名中,第一作者袁景阳是在DeepSeek实习期间完成的这项研究
2025-02-19 12:26:00
梁文锋杨植麟论文撞题,“注意力机制”对大模型意味着什么
...本带来了巨大的计算挑战。NSA(稀疏注意力)在提高效率同时,为提高模型能力提供新的方向,实现将算法创新与硬件对齐的优化相结合,进行高效的长上下文建模。DeepSeek在论文中
2025-02-19 18:43:00
DeepSeek创始人梁文锋:中国AI不可能永远跟随 必然有人站到技术的前沿
...推出的人工智能专用超级计算机),但成本降低了一半,同时能耗减少了40%。2021年,幻方的资产管理规模突破千亿大关,跻身国内量化私募领域的“四大天王”之列。2023年,他宣布
2025-01-27 11:06:00
DeepSeek创始人回家过年 家乡拉横幅:欢迎文锋荣归故里 家乡因你而骄傲
...eek一度登顶苹果中国地区和美国地区应用商店免费APP下载排行榜,甚至被海外称为“来自东方的神秘力量”。【本文结束】如需转载请务必注明出处:快科技责任编辑:雪花文章内容举报
2025-01-31 12:08:00
...,《自然》年度十大人物并非一个奖项,也不是全球前十排行榜,它是对当年重要科学进展、事件以及其中一些关键人物和他们同事的记录。十大人物由《自然》编辑选出,集中反映出影响2025
2025-12-09 07:49:00
更多关于社会的资讯:
她叫Emily(艾米莉),一个地地道道的“河北洋媳妇”。在中国生活的近七年里,她有一个特别的习惯——每到一个地方旅行,就带回一枚当地的文创冰箱贴
2026-03-07 23:18:00
高新区公安春节后接连收到三份“点赞”
胶东在线3月5日讯(通讯员 郭健)春节的喜庆氛围还未散去,烟台高新公安已“收获”满满。近日,辖区群众接连将三面锦旗送到民警手中
2026-03-08 03:03:00
两会,就这Young!丨三八节,AI上闪闪发光的你
大河网讯 2026全国两会期间,恰逢“三八”国际妇女节,我们策划了一份特别的礼物。用AI为平日里忙碌于履职建言的代表们
2026-03-08 00:26:00
桐梓:花海间邂逅乡土艺术 解锁乡村文化新活力
多彩贵州网讯春拂桐梓,花满狮溪,三月风光尽展田园雅韵。3月7日,“贵州村艺·羊磴乡土而新奇”狮溪乡村艺术展在狮溪镇黄坪大坝千亩花海启幕
2026-03-08 02:31:00
祝贺!王跃摘得米兰冬残奥会河北首金
3月7日,王跃夺冠后庆祝。新华社发河北新闻网讯(河北日报记者赵瑞雪)北京时间3月7日,米兰冬残奥会赛场传来捷报,河北省运动员王跃奋勇拼搏
2026-03-07 23:24:00
中国青年报客户端讯(中青报·中青网记者 陈卓琼)在3月6日召开的江西2026年10件民生实事新闻发布会上,“推进书香社会建设”首次被列入全省民生实事项目
2026-03-07 20:57:00
河北新闻网讯(巩嘉祺)2月12日至3月1日,石家庄市维明路小学五年级四班开展了一次为期18天的“海量阅读挑战”活动,旨在引导学生在寒假期间坚持阅读
2026-03-07 22:25:00
..每年3月是学雷锋月,之于很多人而言,雷锋精神走过一甲子,雷锋精神是是课本里“做好事不留名”的典范,是需要踮起脚尖才能触碰的道德高地
2026-03-07 21:32:00
邢台宁晋:工笔画里绘就多彩童年
冀时新闻报道(河北台李永倩苑绍培通讯员武学兵)3月4日,邢台市宁晋县河渠镇依托本地特色,在工笔画实训基地精心组织了一场别开生面的寒假公益研学活动
2026-03-07 17:05:00
实现优质教学资源共建共享 河北省医学教育大模型正式启用
河北新闻网消息,日前,河北医科大学牵头研发的“河北省医学教育大模型”正式启用。据了解,这是一款围绕河北医学与大健康产业人才培养的核心需求
2026-03-07 17:07:00
网警依法严厉查处造谣某知名茶饮品牌“涉毒”等3起网络谣言案
涉企网络谣言严重扰乱公共秩序、破坏营商环境。近期,公安网安部门依托“专业+机制+大数据”新型警务运行模式,持续强化网络生态综合治理
2026-03-07 17:17:00
晨曦微露,三月的西山矿区凉意仍浓。3月5日8时,山西焦煤西山煤电西铭矿修理厂的铁梯上,一道瘦削的身影正稳步向上。她叫郝俊云
2026-03-07 18:15:00
河北新闻网讯(徐燕燕、刘君)在第116个“三八”国际妇女节来临之际,3月6日,秦皇岛市委宣传部举办“书香雅韵·悦己芳华”主题茶诗会活动
2026-03-07 15:26:00
鲁网3月7日讯(记者 李安琦 通讯员 邵雅琪 李璐瑶)近日,在农行平原县支行辖属东方支行营业结束后迎来了一位神色焦急的客户
2026-03-07 15:49:00
阅见成长,语韵育人——临沂第八中学开展英语整本书阅读促进会
鲁网3月7日讯为落实新课标英语学科核心素养,响应区教研室要求,推动英语阅读从“碎片化”走向“系统化、整本书化”,3月6日下午
2026-03-07 15:51:00