• 我的订阅
  • 科技

DeepSeek降本秘诀曝光:2招极致压榨推理部署,算力全留给内部AGI研究

类别:科技 发布时间:2025-07-05 10:58:00 来源:36氪

DeepSeek R1横空出世第128天,已经把整个大模型市场搅得天翻地覆!

首先,它以一己之力把推理模型的价格打下来,OpenAI六月更新的o3价格相比o1直接打了2折。

DeepSeek降本秘诀曝光:2招极致压榨推理部署,算力全留给内部AGI研究

其次,第三方平台托管的DeepSeek模型使用量疯狂增长,比刚发布时涨了将近20倍,成就了大批云计算厂商。

DeepSeek降本秘诀曝光:2招极致压榨推理部署,算力全留给内部AGI研究

然而,DeepSeek自家的网站和API市场份额却不断下降,跟不上AI产品上半年持续增长的节奏了。

DeepSeek降本秘诀曝光:2招极致压榨推理部署,算力全留给内部AGI研究

以上数据来自SemiAnalysis发布的一篇报告,详尽解读了DeepSeek对AI模型竞赛的影响以及AI市场份额的现状。

DeepSeek降本秘诀曝光:2招极致压榨推理部署,算力全留给内部AGI研究

揭开DeepSeek的降本秘诀

DeepSeek刚发布时确实火得一塌糊涂,但四个多月过去了,情况却有点微妙。

从数据来看,DeepSeek自家网站和API的流量不升反降,市场份额也在持续下滑。

到了5月,全网DeepSeek模型产生的token中,来自DeepSeek本家的份额已经只占16%了。

DeepSeek降本秘诀曝光:2招极致压榨推理部署,算力全留给内部AGI研究

网页版聊天机器人流量也大幅下降,而同期其他主要大模型网页版流量都在飙升。

DeepSeek V3与R1模型都经过版本更新,能力与1月相比更强了,价格又便宜,怎么用户反而跑了呢?

这种“墙内开花墙外香”的现象,背后其实大有文章。

SemiAnalysis指出,DeepSeek为了把成本压到极致,在服务质量上还是做了大量妥协。

用户在DeepSeek官方平台上使用模型,经常要等上好几秒才能看到第一个字蹦出来,可以用首token延迟(First token latency)这个指标来衡量。

相比之下,其他平台虽然普遍价格更贵,但响应速度快得多,有些甚至能做到几乎零延迟。

如果想选择更大更稳定的服务商,微软Azure平台价格是DeepSeek官方的2.5倍,但延迟减少了整整25秒。

从另一个角度看,DeepSeek官方甚至不是同等延迟下价格最低的一家DeepSeek模型服务商。

DeepSeek降本秘诀曝光:2招极致压榨推理部署,算力全留给内部AGI研究

如果在这张图上用气泡大小表示上下文窗口,可以看出DeepSeek在价格与性能之间的另一个权衡。

在有限的推理计算资源下,只提供64k上下文窗口的服务,在主流模型提供商中算是最小的之一。

在需要读取整个代码库的编程场景里,64K根本不够用,用户只能选择第三方平台。

而同样价格下,Lambda和Nebius等平台能提供2.5倍以上的上下文窗口。

DeepSeek降本秘诀曝光:2招极致压榨推理部署,算力全留给内部AGI研究

DeepSeek还把很多用户的请求打包在一起处理,虽然每个token的成本降下来了,但每个用户等待的时间也增加了。

大模型下半场:提升每个token的智能

需要明确的是,这些降本策略都是DeepSeek主动做出的决定。

他们目前看上去对用户体验不怎么感兴趣,既无意从用户身上赚钱,也无意通过聊天应用或API服务向用户提供大量token,更多地是专注于实现AGI。

从这些优化策略就可以看出,DeepSeek把尽可能少的算力用作推理服务给外部使用,大量的算力资源留在内部研发用途。

同时配合开源策略,让其他云服务托管他们的模型,赢得影响力和培养生态,两不耽误。

说到底,AI竞赛拼的还是算力资源。

在DeepSeek影响下,Claude也开始降低速度缓解算力紧张的问题,但为了营收还是在努力平衡用户体验。

Claude 4 Sonnet发布以来,输出速度已经下降了40%,但仍然比DeepSeek快不少。

另外Claude模型被设计成生成更简洁的回复,回答同样的问题,DeepSeek和Gemini可能要多花3倍的token。

DeepSeek降本秘诀曝光:2招极致压榨推理部署,算力全留给内部AGI研究

种种迹象表明,大模型供应商正在多维度地改进模型。

不仅仅是提高模型的智能上限,而是提升每个token能提供的智能。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2025-07-06 05:45:02

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

京东云发布八大领先智算产品,助力企业火速用上大模型
...京东云城市大会在深圳顺利举行。会上,京东云发布八大极致性价比的智算产品,五种全场景大模型部署模式,同时推出“开发训练+场景应用”双引擎一站式平台,助力企业实现DeepSeek
2025-02-27 14:14:00
大模型步入推理Scaling时代,SambaNova如何挑战英伟达的霸主地位
...数据传输的大规模计算任务的 HBM。其架构可以自动做到极致的算子融合,达到 90% 以上的 HBM 利用率,使得 RDU 对 GPU 有了 2-4 倍的性能优势
2024-10-21 09:55:00
超擎数智重磅发布擎天、锋锐、元景系列AI服务器,打造人工智能新质生产力强劲引擎
...350W;DDR5技术+PCIe Gen5最新技术支撑;PCIe直通配置低时延打造极致性能;前后 IO维护兼容设计
2024-04-28 14:05:00
昆仑万维重磅发布天工AI高级搜索功能,做最懂金融投资、科研学术的AI搜索
...检索技术的升级。在数据上,天工AI投入了巨大精力追求极致:高质量、权威、实时、专业的金融数据收录,中英文最全学术数据接入。天工AI引入了海量(超过10亿)的专业型数据,包括网
2024-11-05 14:56:00
阿里通义实验室黄斐:开源进入千问时代,即将发布的推理模型会更好用
...开源模型系列,将“很快”放出基于最新模型Qwen2.5-Max的推理模型。2月21日,全球开发者大会(GDC)在上海开幕
2025-02-21 23:22:00
京东率先推出行业首批高商业可用数字人,618向商家免费开放
...尺寸大模型,满足多样化的产业需求:3B和10B模型可提供极致响应效率;81B主力模型可兼顾效果和性能。最新推出的750B超大规模模型,则兼具“深度思考”和“非深度思考”双通道
2025-05-22 18:51:00
对话北大赵东岩:为啥DeepSeek幻觉率这么高?用户如何避免被AI“欺骗”?
...达14.3%,显著高于DeepSeek-V3的3.9%,也远远超过行业的其他推理模型,比如OpenAI-o1的测试结果是2
2025-03-05 15:54:00
致敬浪潮“她”力量丨成功秘诀?不过是把“我能行”,用代码写了千万遍
...”薛娇说。QASC挑战赛是美国艾伦研究所推出的一项常识推理阅读理解任务,它的挑战性在于不仅要求机器能够理解和检索知识,还要求机器将检索到的知识进行组合推理,最终给出合理的答案
2025-03-14 17:54:00
不断创新、协同发展,康佳的秘诀是什么?
...突出成果背后,体现了康佳集团在科研领域对前沿技术的极致追求。除了在前沿科技领域的发力布局之外,康佳还聚焦消费电子领域,形成半导体+消费电子两大主业协同发展。康佳通过并购“新飞
2025-04-21 12:43:00
更多关于科技的资讯:
近年来,随着大模型技术快速发展,国内外科技公司陆续推出AI(人工智能)伴侣产品和服务,这些产品通过文字、语音、图像等交互模式
2026-01-13 07:17:00
王永昌:青年杭商要主动拥抱智能体浪潮
“AI世界澎湃汹涌,我是开疆拓土的先锋……”在1月9日举行的“微光如炬”2026杭州日报财经年会暨二届天下杭商总会年会上
2026-01-13 07:22:00
跨境电商企业在蓬勃发展的同时,也面临着日益复杂的法律风险。为破解行业发展难题,丰富跨境电商法治服务供给,强化企业出海法治指引
2026-01-13 07:22:00
日前,“AI赋能・产业新程”行业大模型概念验证中心首场路演沙龙活动在浙工大人工智能创新研究院(以下简称“浙工大智研院”)举行
2026-01-13 07:23:00
佛山正视利怎么样?品牌硬实力与全民口碑给出答案
在全民视力健康危机日益严峻的当下,我国视力问题人群已高达 7.8 亿,儿童青少年总体近视率近 60%,其中高中生近视率更是飙升至 87
2026-01-12 21:03:00
安建大教师最新研究成果破解心脏病变分割难题
大皖新闻讯 近日,安徽建筑大学陈永麟老师联合南京林业大学、安徽大学及武汉市第三人民医院的专家们,创新性地提出了DAF-Mamba的高性能分割模型
2026-01-12 22:22:00
迪士尼限定快闪登陆马来西亚,杰森娱乐“生态出海”加速市场开拓
2026年1月9日,马来西亚吉隆坡核心商业地标LaLaport BBCC的ACG BASE正式上演为期一个多月的大型主题快闪——这是杰森娱乐集团携手迪士尼以及国际知名插画师Mik
2026-01-12 17:34:00
网络视听向何处发展?第五届网络视听创新发展论坛举办
中国青年报客户端讯(中青报·中青网记者余冰玥沈杰群)近日,“新大众文艺·新视听使命”第五届网络视听创新发展论坛在北京举办
2026-01-12 17:34:00
打开手机,刷几条短视频,准能看见一条养生秘籍;翻几页朋友圈,也少不了长辈们转发的健康预警。从“吃木薯助眠”到“冷冻馒头会长黄曲霉毒素”
2026-01-12 18:18:00
中国消费者报北京讯(记者聂国春)1月8日,北京智源人工智能研究院发布年度报告《2026十大AI技术趋势》。报告指出,人工智能的演进核心正发生关键转移
2026-01-12 19:35:00
近日,连江县古石村夜景照明设计作品“古石微光”接连斩获2025年美国LIT照明设计奖与2025美国IDA国际设计大奖两项国际大奖。
2026-01-12 19:40:00
中国消费者报报道(记者桑雪骐)2025年12月,市场监管总局公布5起民生领域私域直播虚假宣传典型案例。1月7日,市场监管总局发布《直播电商监督管理办法》《网络交易平台规则监督管理办法》
2026-01-12 19:05:00
三联家电41周年店庆:多重补贴叠加,引领春节消费热潮
鲁网1月12日讯新春佳节渐近,山东家电零售行业的领军品牌——三联家电迎来41周年庆典。1月16日至25日期间,一场盛大的店庆活动即将热烈展开
2026-01-12 17:01:00
随着全球环保法规日趋严苛,挥发性有机物(VOCs)治理成为工业企业合规运营的关键环节,沸石转轮吸附浓缩技术因高效节能的特性
2026-01-12 16:56:00
创意碰撞青春,立达 Z 世代・名流广告创意赛圆满落幕
当 Z 世代的脑洞与广告艺术激情碰撞,当校企协同的育人理念落地生根,一场聚焦创意与热爱的行业盛事圆满收官。12月29日
2026-01-12 16:58:00