• 我的订阅
  • 社会

同时登顶中美下载排行榜,DeepSeek凭啥超越GPT?看它自己怎么回答

类别:社会 发布时间:2025-01-27 23:15:00 来源:杭州网

潮新闻讯 辞旧迎新之际,如旋风般席卷全球AI圈的浙产AI大模型DeepSeek,继续创造历史。

同时登顶中美下载排行榜,DeepSeek凭啥超越GPT?看它自己怎么回答

图源:苹果美国区应用商店

1月27日,DeepSeek应用登顶苹果美国地区应用商店免费App下载排行榜,力压此前霸榜的OpenAI的ChatGPT,而排在第三名的是Meta旗下的Threads。

同日,苹果中国区应用商店免费榜显示,DeepSeek成为中国区第一。

同时登顶中美下载排行榜,DeepSeek凭啥超越GPT?看它自己怎么回答

图源:苹果中国区应用商店

作为“神秘东方力量”的组成部分、“杭州科技六小龙”之一,国产大模型公司深度求索(DeepSeek)被认为是大模型行业的最大“黑马”。2024年底,其以极低的算力(仅为同行的1/11)和GPU芯片数量(2000个)训练出了性能超越GPT-4o的大模型DeepSeek-V3,总训练成本仅557.6万美元(GPT-4约为7800万美元),被誉为“AI界的拼多多”。

同时登顶中美下载排行榜,DeepSeek凭啥超越GPT?看它自己怎么回答

图源:DeepSeek官网

去年12月DeepSeek-V3发布后,轰动世界AI圈。不到一个月之后,今年1月20日,DeepSeek正式开源R1推理模型。

据DeepSeek介绍,其最新发布的模型DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1正式版。

低成本实现高性能模型研发,对用户来说的体验感也立竿见影——它功能强大,但却免费使用,并且DeepSeek还将代码面向开发者进行了开源。

据了解,DeepSeek R1没有使用业内普遍使用的监督微调(SFT)训练范式,而是直接通过强化学习让模型自主进化出复杂的推理能力,包括反思和长链思考等能力。这种方法不仅提高了训练效率,还减少了对昂贵计算资源的依赖。

1月24日,一条发布在teamblind平台上的帖子疯传。一名Meta员工称,现在Meta内部因为DeepSeek的模型,已进入恐慌模式。

这位Meta员工写道:“一切源于DeepSeek-V3的出现,它在基准测试中已经让Llama4相形见绌。更让人难堪的是,一家‘仅用550万美元训练预算的中国公司’就做到了这一点。工程师们正在争分夺秒地分析DeepSeek,试图复制其中的一切可能技术……当部门里一个高管的薪资就超过训练整个DeepSeek V3的成本,而且这样的高管还有数十位,他们该如何向高层交代?”

潮新闻记者在手机上下载了R1免费版本的DeepSeek应用,尝试着让它写一副蛇年春联,其中要包括“龙”与“蛇”。大约两三秒就给出了结果,有对仗的上下联和横批,还写了一段文字来解读这幅对联的寓意,十分周全。

同时登顶中美下载排行榜,DeepSeek凭啥超越GPT?看它自己怎么回答

同时,记者增加难度,让它模仿贾谊的《过秦论》写一下隋朝,以《过隋论》为标题。不到一分钟,它就写了洋洋洒洒一大篇,按时间顺序,从隋文帝杨坚的开皇之治到隋炀帝杨广的倒行逆施导致隋朝二世而亡都写到了,条理清晰,观点鲜明。

同时登顶中美下载排行榜,DeepSeek凭啥超越GPT?看它自己怎么回答

最后,记者问它“为什么能够在美国苹果免费应用下载榜上超越ChatGPT”,它给出的答案就有点泛泛而谈了,给人一种“车轱辘话”的感觉。

同时登顶中美下载排行榜,DeepSeek凭啥超越GPT?看它自己怎么回答

1月26日,游戏科学创始人、CEO,《黑神话:悟空》制作人冯骥在微博上评价DeepSeek:可能是个国运级别的科技成果。

冯骥表示:“希望DeepSeek R1会让你对当前最先进的AI祛魅,让AI逐渐变成你生活中的水和电。太幸运了!太开心了!这样震撼的突破,来自一个纯粹的中国公司。知识与信息平权,至此又往前迈出了坚实的一步。”

同时登顶中美下载排行榜,DeepSeek凭啥超越GPT?看它自己怎么回答

图源:冯骥微博账号

值得一提的是,1月20日,深度求索的创始人梁文锋参加了国务院总理李强主持召开的专家、企业家和教科文卫体等领域代表座谈会。

据东方网报道,梁文锋本科、研究生毕业于浙江大学,拥有信息与电子工程学系本科和硕士学位。2008年起,他开始带领团队使用机器学习等技术探索全自动量化交易。2023年7月,DeepSeek正式成立,进军通用人工智能领域,至今从未对外融资。

DeepSeek团队规模不大,不到 140 人,但 “人才密度” 极高,成员多是来自清华、北大、北航等顶尖高校的应届博士毕业生、在读生以及硕士生。值得一提的是,团队没有“海归”,完全本土人才。

同时登顶中美下载排行榜,DeepSeek凭啥超越GPT?看它自己怎么回答

左一为梁文锋。图源:央视新闻截图

梁文锋秉持“看能力,不看经验”的理念,“选人的标准一直都是热爱和好奇心”,这吸引了大量年轻高潜人才,让众多 35 岁以下、工作经验不超五年的年轻人有充分的施展才华的舞台。

在团队管理上,梁文锋采用扁平化管理,淡化职级,鼓励自由讨论和创新,成员依兴趣选择研究方向并自由组队。当一个有潜力的构想出现时,公司会自上而下调配资源。而且,成员对资源和人员的调动不设上限,不存在层级和跨部门的限制,只要有想法,随时可以灵活调用。

梁文锋观点:

“我们创新缺的肯定不是资本,而是缺乏信心以及不知道怎么组织高密度的人才实现有效的创新。”

“对顶级人才吸引最大的,肯定是去解决世界上最难的问题。”

“创新不完全是商业驱动的,还需要好奇心和创造欲。”

“开源更像一个文化行为,而非商业行为。给予其实是一种额外的荣誉。一个公司这么做也会有文化的吸引力。”

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2025-01-28 05:45:03

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

DeepSeek创始人老家成热门打卡地:家长带着孩子拍照打卡
...eek一度登顶苹果中国地区和美国地区应用商店免费APP下载排行榜,甚至被海外称为“来自东方的神秘力量”。【本文结束】如需转载请务必注明出处:快科技责任编辑:若风文章内容举报
2025-02-01 23:09:00
DeepSeek,这条诞生在杭州的“鲸鱼” 这几天在全球科技圈、资本圈掀起滔天巨浪
...名为DeepSeek(深度求索)的风暴,正在席卷全球。昨天,中美两国的苹果应用商店同时被一条“鲸鱼”攻占。作为一款来自中国的AI应用
2025-01-28 07:53:00
腾讯、阿里都碰壁!梁文锋拒绝投资:不想用DeepSeek赚快钱
...司Andreessen Horowitz(a16z)发布的最新生成式AI消费级应用排行榜。DeepSeek自2025年1月20日正式上线以来
2025-03-11 17:49:00
...约束——它保留了HC的表达能力(可学习的连接权重),同时通过数学性质保证了稳定性(加权平均不会爆炸)。在自由和约束之间找平衡,这个思路可能在很多领域都适用。这也解释了Deep
2026-01-03 08:31:00
DeepSeek发布最新NSA技术论文!创始人梁文锋参与引人注目
...于NSA(即Natively Sparse Attention,原生稀疏注意力)。与此同时,在论文署名中,第一作者袁景阳是在DeepSeek实习期间完成的这项研究
2025-02-19 12:26:00
梁文锋杨植麟论文撞题,“注意力机制”对大模型意味着什么
...本带来了巨大的计算挑战。NSA(稀疏注意力)在提高效率同时,为提高模型能力提供新的方向,实现将算法创新与硬件对齐的优化相结合,进行高效的长上下文建模。DeepSeek在论文中
2025-02-19 18:43:00
DeepSeek创始人梁文锋:中国AI不可能永远跟随 必然有人站到技术的前沿
...推出的人工智能专用超级计算机),但成本降低了一半,同时能耗减少了40%。2021年,幻方的资产管理规模突破千亿大关,跻身国内量化私募领域的“四大天王”之列。2023年,他宣布
2025-01-27 11:06:00
DeepSeek创始人回家过年 家乡拉横幅:欢迎文锋荣归故里 家乡因你而骄傲
...eek一度登顶苹果中国地区和美国地区应用商店免费APP下载排行榜,甚至被海外称为“来自东方的神秘力量”。【本文结束】如需转载请务必注明出处:快科技责任编辑:雪花文章内容举报
2025-01-31 12:08:00
...,《自然》年度十大人物并非一个奖项,也不是全球前十排行榜,它是对当年重要科学进展、事件以及其中一些关键人物和他们同事的记录。十大人物由《自然》编辑选出,集中反映出影响2025
2025-12-09 07:49:00
更多关于社会的资讯:
生命线上的温度!301医院心血管内科三病区的6日治护
当187/130的血压数值如闪电在仪器上闪现,当136次的心跳在胸腔里擂起不安的战鼓,我知道,这场与身体的沉默对峙已到了临界点
2026-02-13 11:08:00
胶东在线2月13日讯 由烟台市新兴产业发展推进中心(核电办)指导,烟台众创核电研发中心、胶东在线网站、烟台核能科创传媒有限公司主办的“绿色核能 智慧领航”第二届烟台核能科普征文暨
2026-02-13 11:11:00
鲁网2月13日讯(记者 崔新孝 通讯员 安文 时林月)中国工商银行淄博分行积极响应国家“做好五篇大文章”战略部署,聚焦数字金融创新
2026-02-13 11:26:00
腋窝肿块藏凶险 精准施治破危局
近日,涟水县人民医院滨河院区血液风湿免疫科联合多学科团队,历经半年精准施治,成功将一名病情凶险的70岁急性髓系白血病患者从死亡线上拉回
2026-02-13 11:27:00
2026春节出境游新趋势,蚂蚁阿福等国产“AI三件套”成标配
寒假开启,加上“史上最长春节假期”的刺激,直接催热了出境游。在今年的出境游大军中,将“蚂蚁阿福”等国产AI应用装上手机陪伴自己的行程
2026-02-13 11:32:00
童声讲文物 薪火代代传 遵义市博物馆“小小讲解员”上岗记
多彩贵州网讯“各位观众,请看这件汉代时期的石马,它是两千年前这片土地发展的珍贵见证,也是川黔古道作为古代交通要塞的实物佐证……”近日
2026-02-13 11:34:00
播州:四代传承守初心 古法麦芽糖迎“新生”
多彩贵州网讯 走进播州区三合镇长丰村,空气中弥漫着浓郁的年味,一股清甜醇厚麦香格外动人。这缕香气,承载着一个家族四代人的熬糖记忆
2026-02-13 11:34:00
大量金桔凌晨掉落在道路上 六安交通执法人员紧急帮忙
大皖新闻讯 2月13日凌晨5时许,天还未亮,六安市交通执法支队叶集超限超载检测站执法人员巡查至大顾店街道往西进入G312交口时
2026-02-13 11:40:00
特别海报丨杨靖宇将军诞辰121周年
中国吉林网 吉刻新闻本期编辑 吴美慧设计 王丽华
2026-02-13 11:40:00
大河网讯 “孟祥来啦!”“大网红,取餐在这儿!”临近春节,作为全国知名的服装集散地,坐落于郑州火车站周边的银基商圈依旧人声鼎沸
2026-02-13 11:42:00
中国消费者报北京讯(记者孟刚)2月12日,国家医保局印发一般治疗类和药学类两批医疗服务价格项目立项指南,将一般治疗类已有价格项目规范整合为63项
2026-02-13 11:42:00
大红灯笼高高挂,冀A喊你回家过年啦!
2026-02-13 11:54:00
淞涛社区:新春暖流汇异乡,党组织关怀抚人心
江南时报讯 为切实关爱辖区新业态新就业群体,让身处困境、远在他乡的奋斗者感受到党组织的温暖与城市的包容,近日,苏州工业园区斜塘街道淞涛社区党总支书记
2026-02-13 12:01:00
鲁网2月13日讯近日,莱芜农商银行口镇支行厅堂营销经理的办公桌上,一封字迹朴实的手写感谢信格外暖心。信中陈林村五保户陈大爷字字恳切
2026-02-13 12:01:00
中国消费者报郑州讯(记者耿记安)2月12日,河南省市场监管局发布春节特种设备安全提示,提醒消费者使用垂直电梯、自动扶梯
2026-02-13 12:12:00