• 我的订阅
  • 社会

同时登顶中美下载排行榜,DeepSeek凭啥超越GPT?看它自己怎么回答

类别:社会 发布时间:2025-01-27 23:15:00 来源:杭州网

潮新闻讯 辞旧迎新之际,如旋风般席卷全球AI圈的浙产AI大模型DeepSeek,继续创造历史。

同时登顶中美下载排行榜,DeepSeek凭啥超越GPT?看它自己怎么回答

图源:苹果美国区应用商店

1月27日,DeepSeek应用登顶苹果美国地区应用商店免费App下载排行榜,力压此前霸榜的OpenAI的ChatGPT,而排在第三名的是Meta旗下的Threads。

同日,苹果中国区应用商店免费榜显示,DeepSeek成为中国区第一。

同时登顶中美下载排行榜,DeepSeek凭啥超越GPT?看它自己怎么回答

图源:苹果中国区应用商店

作为“神秘东方力量”的组成部分、“杭州科技六小龙”之一,国产大模型公司深度求索(DeepSeek)被认为是大模型行业的最大“黑马”。2024年底,其以极低的算力(仅为同行的1/11)和GPU芯片数量(2000个)训练出了性能超越GPT-4o的大模型DeepSeek-V3,总训练成本仅557.6万美元(GPT-4约为7800万美元),被誉为“AI界的拼多多”。

同时登顶中美下载排行榜,DeepSeek凭啥超越GPT?看它自己怎么回答

图源:DeepSeek官网

去年12月DeepSeek-V3发布后,轰动世界AI圈。不到一个月之后,今年1月20日,DeepSeek正式开源R1推理模型。

据DeepSeek介绍,其最新发布的模型DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1正式版。

低成本实现高性能模型研发,对用户来说的体验感也立竿见影——它功能强大,但却免费使用,并且DeepSeek还将代码面向开发者进行了开源。

据了解,DeepSeek R1没有使用业内普遍使用的监督微调(SFT)训练范式,而是直接通过强化学习让模型自主进化出复杂的推理能力,包括反思和长链思考等能力。这种方法不仅提高了训练效率,还减少了对昂贵计算资源的依赖。

1月24日,一条发布在teamblind平台上的帖子疯传。一名Meta员工称,现在Meta内部因为DeepSeek的模型,已进入恐慌模式。

这位Meta员工写道:“一切源于DeepSeek-V3的出现,它在基准测试中已经让Llama4相形见绌。更让人难堪的是,一家‘仅用550万美元训练预算的中国公司’就做到了这一点。工程师们正在争分夺秒地分析DeepSeek,试图复制其中的一切可能技术……当部门里一个高管的薪资就超过训练整个DeepSeek V3的成本,而且这样的高管还有数十位,他们该如何向高层交代?”

潮新闻记者在手机上下载了R1免费版本的DeepSeek应用,尝试着让它写一副蛇年春联,其中要包括“龙”与“蛇”。大约两三秒就给出了结果,有对仗的上下联和横批,还写了一段文字来解读这幅对联的寓意,十分周全。

同时登顶中美下载排行榜,DeepSeek凭啥超越GPT?看它自己怎么回答

同时,记者增加难度,让它模仿贾谊的《过秦论》写一下隋朝,以《过隋论》为标题。不到一分钟,它就写了洋洋洒洒一大篇,按时间顺序,从隋文帝杨坚的开皇之治到隋炀帝杨广的倒行逆施导致隋朝二世而亡都写到了,条理清晰,观点鲜明。

同时登顶中美下载排行榜,DeepSeek凭啥超越GPT?看它自己怎么回答

最后,记者问它“为什么能够在美国苹果免费应用下载榜上超越ChatGPT”,它给出的答案就有点泛泛而谈了,给人一种“车轱辘话”的感觉。

同时登顶中美下载排行榜,DeepSeek凭啥超越GPT?看它自己怎么回答

1月26日,游戏科学创始人、CEO,《黑神话:悟空》制作人冯骥在微博上评价DeepSeek:可能是个国运级别的科技成果。

冯骥表示:“希望DeepSeek R1会让你对当前最先进的AI祛魅,让AI逐渐变成你生活中的水和电。太幸运了!太开心了!这样震撼的突破,来自一个纯粹的中国公司。知识与信息平权,至此又往前迈出了坚实的一步。”

同时登顶中美下载排行榜,DeepSeek凭啥超越GPT?看它自己怎么回答

图源:冯骥微博账号

值得一提的是,1月20日,深度求索的创始人梁文锋参加了国务院总理李强主持召开的专家、企业家和教科文卫体等领域代表座谈会。

据东方网报道,梁文锋本科、研究生毕业于浙江大学,拥有信息与电子工程学系本科和硕士学位。2008年起,他开始带领团队使用机器学习等技术探索全自动量化交易。2023年7月,DeepSeek正式成立,进军通用人工智能领域,至今从未对外融资。

DeepSeek团队规模不大,不到 140 人,但 “人才密度” 极高,成员多是来自清华、北大、北航等顶尖高校的应届博士毕业生、在读生以及硕士生。值得一提的是,团队没有“海归”,完全本土人才。

同时登顶中美下载排行榜,DeepSeek凭啥超越GPT?看它自己怎么回答

左一为梁文锋。图源:央视新闻截图

梁文锋秉持“看能力,不看经验”的理念,“选人的标准一直都是热爱和好奇心”,这吸引了大量年轻高潜人才,让众多 35 岁以下、工作经验不超五年的年轻人有充分的施展才华的舞台。

在团队管理上,梁文锋采用扁平化管理,淡化职级,鼓励自由讨论和创新,成员依兴趣选择研究方向并自由组队。当一个有潜力的构想出现时,公司会自上而下调配资源。而且,成员对资源和人员的调动不设上限,不存在层级和跨部门的限制,只要有想法,随时可以灵活调用。

梁文锋观点:

“我们创新缺的肯定不是资本,而是缺乏信心以及不知道怎么组织高密度的人才实现有效的创新。”

“对顶级人才吸引最大的,肯定是去解决世界上最难的问题。”

“创新不完全是商业驱动的,还需要好奇心和创造欲。”

“开源更像一个文化行为,而非商业行为。给予其实是一种额外的荣誉。一个公司这么做也会有文化的吸引力。”

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2025-01-28 05:45:03

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

DeepSeek创始人老家成热门打卡地:家长带着孩子拍照打卡
...eek一度登顶苹果中国地区和美国地区应用商店免费APP下载排行榜,甚至被海外称为“来自东方的神秘力量”。【本文结束】如需转载请务必注明出处:快科技责任编辑:若风文章内容举报
2025-02-01 23:09:00
DeepSeek,这条诞生在杭州的“鲸鱼” 这几天在全球科技圈、资本圈掀起滔天巨浪
...名为DeepSeek(深度求索)的风暴,正在席卷全球。昨天,中美两国的苹果应用商店同时被一条“鲸鱼”攻占。作为一款来自中国的AI应用
2025-01-28 07:53:00
腾讯、阿里都碰壁!梁文锋拒绝投资:不想用DeepSeek赚快钱
...司Andreessen Horowitz(a16z)发布的最新生成式AI消费级应用排行榜。DeepSeek自2025年1月20日正式上线以来
2025-03-11 17:49:00
DeepSeek发布最新NSA技术论文!创始人梁文锋参与引人注目
...于NSA(即Natively Sparse Attention,原生稀疏注意力)。与此同时,在论文署名中,第一作者袁景阳是在DeepSeek实习期间完成的这项研究
2025-02-19 12:26:00
梁文锋杨植麟论文撞题,“注意力机制”对大模型意味着什么
...本带来了巨大的计算挑战。NSA(稀疏注意力)在提高效率同时,为提高模型能力提供新的方向,实现将算法创新与硬件对齐的优化相结合,进行高效的长上下文建模。DeepSeek在论文中
2025-02-19 18:43:00
DeepSeek创始人梁文锋:中国AI不可能永远跟随 必然有人站到技术的前沿
...推出的人工智能专用超级计算机),但成本降低了一半,同时能耗减少了40%。2021年,幻方的资产管理规模突破千亿大关,跻身国内量化私募领域的“四大天王”之列。2023年,他宣布
2025-01-27 11:06:00
DeepSeek创始人回家过年 家乡拉横幅:欢迎文锋荣归故里 家乡因你而骄傲
...eek一度登顶苹果中国地区和美国地区应用商店免费APP下载排行榜,甚至被海外称为“来自东方的神秘力量”。【本文结束】如需转载请务必注明出处:快科技责任编辑:雪花文章内容举报
2025-01-31 12:08:00
AI圈开年首炸:139位中国清北名校天才 创立一家震撼硅谷的企业
...,DeepSeek的团队规模虽小,但实力不容小觑。其创始人梁文锋领导的团队仅有139名工程师和研究人员,相比之下,OpenAI拥有1200名研究人员
2025-01-12 14:52:00
腾讯猛攻AI的底气:去年日赚6亿元,马化腾见过梁文锋后亲自定调
...资本开支就达到365.78亿元,超过2023年全年的资本开支。同时,腾讯财报还提到,2024年第四季度,AI项目发展所涉及的资本开支为390亿元。资本开支主要包括对计算机设备
2025-03-20 16:39:00
更多关于社会的资讯:
高低据《人民日报》报道,近来许多读者、网友反映,在一些学生自主寻找的非实践教学实习中,由于缺乏对实习生劳动权益的明确规范
2025-10-22 14:07:00
齐鲁晚报·齐鲁壹点 国晓宁 通讯员 殷庆红10月10日,太平人寿聊城中支接到一位客户致电,专门感谢公司高效赔付。该客户从提交理赔申请到结案仅用时30分钟
2025-10-22 14:09:00
近日,建行聊城湖滨支行迎来了一位略显焦急的老先生。柜员小葛热情地接待了他。经了解,这位客户目前定居日本,此次是专程来聊城旅游
2025-10-22 14:10:00
首例!特殊手术让她“抱娃”与“抗癌”两不误
发病率仅1.5-12/10万的妊娠合并宫颈癌,让孕中期的倩蓉遭遇了影视剧中才有的“保大人还是保孩子”困境。一边是好不容易怀上的宝宝
2025-10-22 14:34:00
双首例落地!吉大一院技术支持,日照机器人手术实现 “零的突破”
2025 年 10 月 16 日,吉林大学第一医院日照医院(日照市人民医院高新院区)正式启用,启用当日便传来医疗技术突破的消息
2025-10-22 14:34:00
文化京圈儿专题报道:2025北京国际非遗周--用传统智慧焕新美好生活
文化京圈儿新闻中心 闻铎雅 王兴莉 丁原 赵琪 王浩宇中国.北京 | 2025年10月导语:非遗不止是历史的智慧,亦是点燃未来美好生活的火种
2025-10-22 14:37:00
济宁方特精灵奇妙夜免费公交来啦!附详细运营路线
路线一:运营日期:10月17、18、19、24、25、26、31号, 11月1、2、7、8、9号。运营路线:职业技术学院(金宇路)—太白路万达广场(济宁第一职业中专)—运河城(贵和购物中心)—吾悦广场—济宁方特发车时间
2025-10-22 14:44:00
济医附院自动化腹膜透析(APD),点亮尿毒症患者的生命之路
齐鲁晚报·齐鲁壹点 褚思雨 通讯员 王彦彦 焦占峰对尿毒症患者而言,“透析” 二字承载着生命续航的重量。传统血液透析需每周3次
2025-10-22 15:21:00
术后俩月迎好孕还得双胞胎!菏泽耿女士携娃致谢李婷主任
来自山东菏泽的耿女士近日带着她一对可爱的双胞胎儿子,再次走进济南红绘医院,紧紧握住了李婷主任的双手。千言万语,此刻都化作了一句真挚的“谢谢”
2025-10-22 15:21:00
七旬退休外教斯蒂芬再访合肥 称合肥给自己留下很多美好回忆
大皖新闻讯 Stephen(斯蒂芬)来自加拿大,2005-2015年在中国工作,曾荣获安徽省人民政府第13届“黄山友谊奖”
2025-10-22 15:36:00
全市地震秒级预警和分钟级烈度速报!德州建成市级地震速报系统
齐鲁晚报·齐鲁壹点 李梦晴10月22日,德州市召开“十四五”发展成就系列主题新闻发布会第七场,介绍“十四五”期间全市应急管理工作高质量发展成就
2025-10-22 17:07:00
九旬患者家属赠字画致敬老党员医生:六十年坚守诠释医者仁心
鲁网10月22日讯近日,一位九旬患者家属怀着真挚的感激之情,将三幅精心装裱的感谢字画赠予曹县中医医院中医专家王复寅医生
2025-10-22 17:09:00
三面锦旗的重量:普外一科用专业托起生命希望
鲁网10月22日讯近日,患者于女士(化名)及家属专程来到荣成市人民医院普外一科,将三面锦旗和表扬信分别赠送给科室主任、主治医生及护理团队
2025-10-22 17:11:00
潍坊昌乐又一公司在新三板成功挂牌
鲁网10月22日讯10月22日上午,潍坊精华粉体科技股份有限公司在新三板基础层成功挂牌,证券代码:873404。该公司于2000年10月在山东省潍坊市昌乐县注册
2025-10-22 17:11:00
鲁网10月22日讯每年的10月24日是联合国日,为引导学生了解联合国使命、树立人类命运共同体意识,莒南县第三小学于2025年10月20举行“同一个家园”联合国日主题活动
2025-10-22 17:14:00