• 我的订阅
  • 科技

技术奇迹!清华突破大模型算力难题 RTX 4090单枪匹马就能跑满血版DeepSeek

类别:科技 发布时间:2025-02-15 10:52:00 来源:浅语科技

快科技2月15日消息,清华团队突破大模型算力难题,这让英伟达情何以堪。

据国内媒体报道称,清华大学KVCache.AI团队联合趋境科技发布的KTransformers开源项目迎来重大更新,成功打破大模型推理算力门槛。

此次KTransformers项目更新带来重大突破,支持在24G显存(4090D)的设备上本地运行DeepSeek-R1、V3的671B满血版。

KTransformers项目的核心在于异构计算策略:稀疏性利用:MoE架构每次仅激活部分专家模块,团队将非共享的稀疏矩阵卸载至CPU内存,结合高速算子处理,显存占用压缩至24GB。

量化与算子优化:采用4bit量化技术,配合Marlin GPU算子,效率提升3.87倍;CPU端通过llamafile实现多线程并行,预处理速度高达286 tokens/s。

CUDA Graph加速:减少CPU/GPU通信开销,单次解码仅需一次完整的CUDA Graph调用,生成速度达14 tokens/s。

这带来了怎样的后果呢?传统方案:8卡A100服务器成本超百万,按需计费每小时数千元。

现在,单卡RTX 4090方案:整机成本约2万元,功耗80W,适合中小团队与个人开发者。

NVIDIA RTX 4090运行DeepSeek-R1满血版的案例,不仅是技术奇迹,更是开源精神与硬件潜能结合的典范。它证明:在AI狂飙的时代,创新往往源于对“不可能”的挑战。

技术奇迹!清华突破大模型算力难题 RTX 4090单枪匹马就能跑满血版DeepSeek

【本文结束】如需转载请务必注明出处:快科技

责任编辑:雪花

文章内容举报

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2025-02-15 14:45:06

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

梦想当“燃”|不断破局!这个浪潮青年团队如何让大模型实现“量身定制”
在从无到有的创新之路上,真正的突破从来不是单枪匹马的奇迹,而是并肩携手穿过一个又一个的荆棘。科技革命的星辰大海,永远属于那些既敢仰望星空、又能携手同行的开拓者。“浪潮青年五四奖章
2025-05-29 12:33:00
中国算力全球第二:“大力”如何出奇迹?
...)“大力出奇迹。”10月13日,中国工程院院士、CCF会士、清华大学计算机系教授郑纬民在2023世界数字经济大会暨第十三届智慧城市与智能经济博览会主论坛上表示,中国算力位居全
2023-10-13 20:58:00
清华大学获芯片领域重要突破!
来源:极目新闻科技日报记者华凌记者11日从清华大学获悉,针对大规模光电智能计算难题,清华大学电子工程系副教授方璐课题组、自动化系戴琼海院士课题组,摒弃传统电子深度计算范式,另辟蹊
2024-04-12 10:19:00
边缘大模型狂飙落地!清华系GPGPU惊艳WAIC,解读“六边形战士”处理器
...署背后的一个关键角色就是底层芯片玩家。WAIC上,一家清华系GPGPU创企的展台上,我们看到其AI加速卡AzureBlade K340l已经可以支撑大模型跑在AI PC等设备上
2024-07-08 09:58:00
同一天2篇Nature!清华两团队最新科研突破!
北京时间5月30日清华大学2项最新科研成果同时发表于《自然》(Nature)清华大学依托精密仪器系的类脑计算研究中心施路平教授团队提出一种基于视觉原语的互补双通路类脑视觉感知新范
2024-05-30 09:46:00
清华团队提出新型光计算架构,光训练速度提升1个数量级
近期,清华大学电子工程系方璐教授课题组、自动化系戴琼海教授课题组创新性地设计了全前向智能光计算训练架构,开发出一种名为“太极-II”的通用光训练芯片。该架构摆脱了对电计算离线训练
2024-08-09 09:57:00
清华量子计算成果登顶刊,来自丘成桐数学中心团队
...领域首次发现!噪声会造成量子优势突然消亡。这是来自清华大学丘成桐数学科学中心助理教授魏朝晖团队的最新研究成果,刚刚登上Science子刊。(相关成果以“关联生成中量子优势的突
2024-11-28 12:04:00
光电融合新突破!清华大学建立光电智能计算架构—ACCEL芯片
据清华大学消息,近日,清华大学自动化系戴琼海院士、吴嘉敏助理教授与电子工程系方璐副教授、乔飞副研究员联合攻关,提出一种“挣脱摩尔定律的新型智能计算架构”——ACCEL全模拟光电智
2023-11-05 13:34:00
...呈现省内外48所国内顶尖学府的351项尖端科技成果。比如清华大学全球首发的“猛狮第三代飞行汽车”,突破了大载重下飞行汽车运输距离受限的技术难题、突破了传统车辆与飞行器的耦合模
2025-04-24 19:00:00
更多关于科技的资讯:
一口喜旺味,岁岁皆安康,解锁新年团圆仪式感
节庆馈赠的品质选择,源自对风险管控与生产闭环的极致追求。喜旺凭借其贯穿全链路的“风险驱动+全过程控制”体系,将“安心”转化为可测量
2026-01-30 14:53:00
新消费时代植物医生的 “空间重构”:从货架到生命场的 “实体进化”
“虚拟世界缺乏信任的最终载体,如果产品有问题,顾客可以找到你。这是线下店最根本的力量。”2026年1月初,在深圳举办年会时
2026-01-30 15:11:00
章丘首店!三联家电入驻世茂广场,2月6日盛大启幕!
鲁网1月29日讯三联家电,扎根齐鲁四十一载,“买家电,到三联,三联家电,保修终生”,这句话承载着几代人的回忆,随着家电市场的不断变迁
2026-01-30 15:31:00
娇韵诗撤下彩妆代言人金晨置顶微博
大皖新闻讯 1月30日下午,大皖新闻记者注意到,娇韵诗官方微博撤下彩妆代言人金晨相关的置顶内容。目前该微博账号置顶微博为迪丽热巴相关内容
2026-01-30 15:51:00
在经济全球化深入推进的背景下,跨境贸易已成为推动经济增长的重要引擎,而高效、安全的外汇服务则是保障跨境贸易顺畅开展的关键支撑
2026-01-30 16:02:00
沂水农商银行绘就“异业联盟”新图景
鲁网1月30日讯在数字化转型与民生服务升级的双重浪潮下,沂水农商银行立足县域金融服务本源,推出“异业联盟生活圈平台”,直面发展痛点
2026-01-30 16:04:00
黄河三角洲商业再升级!大润发东营首店开业,打造 \
鲁网1月30日讯 (记者 王娟)2026 年 1 月 30 日,黄河三角洲中心城市东营迎来商业发展重要节点 ——大润发东营首店正式亮相东城万达广场
2026-01-30 16:05:00
当奢侈品回归身体本身:VOYMEKA以此定义新时代的“静奢”美学
随着全球高端消费市场的风向转变,曾经风靡一时的大Logo狂热正在退潮。在当下高净值人群的消费清单中,一种被称为静奢风的生活哲学正在迅速崛起
2026-01-30 16:07:00
蚂蚁集团开源“灵波”四款模型,开启具身智能基座开源新时代,海外开发者反响热烈
近日,全球科技巨头谷歌于凌晨发布了其备受瞩目的世界模型体验平台Project Genie,向美国Google AI Ultra订阅用户开放试用
2026-01-30 16:30:00
人工智能在金融领域的深度融合与有效应用,根植于数据、算力、算法三大要素的协同支撑,同时也离不开安全可信的网络环境。为有效破解人工智能金融应用的现实瓶颈
2026-01-30 16:33:00
中新经纬1月30日电 据华尔街日报中文网30日消息,知情人士称,OpenAI正为今年第四季度公开上市铺路,随着与竞争对手Anthropic的竞争加剧
2026-01-30 11:42:00
临沂联通“山东通”运维团队高效应对“银狐”病毒威胁
鲁网1月30日讯近日,一种名为“银狐”的新型木马病毒变种在网络上活跃,其通过多渠道实施钓鱼式攻击,攻击目标主要针对政府机构及企事业单位的“山东通”用户
2026-01-30 11:59:00
杭州有个“绘生工厂” 器官也能3D打印了
制图 高薇3D打印的心脏 你也许见过3D打印的玩具、零件或模型,可你听过能打印一颗“活心脏”的3D打印机吗?这听上去像科幻片的场景
2026-01-30 08:22:00
宠物正成为越来越多家庭的重要成员,但“毛孩子”看病贵、看病难的问题也让养宠人忧心。中国畜牧业协会(宠物产业分会)《2025 年中国宠物行业白皮书(消费报告)》显示
2026-01-30 08:30:00
1月27日,2026江苏省城市足球联赛商务合作发布会在江苏省体育局举行。会议现场,龙蟠科技获颁官方赞助商授牌,正式开启2026年与联赛的全新合作篇章
2026-01-30 09:51:00