• 我的订阅
  • 科技

技术奇迹!清华突破大模型算力难题 RTX 4090单枪匹马就能跑满血版DeepSeek

类别:科技 发布时间:2025-02-15 10:52:00 来源:浅语科技

快科技2月15日消息,清华团队突破大模型算力难题,这让英伟达情何以堪。

据国内媒体报道称,清华大学KVCache.AI团队联合趋境科技发布的KTransformers开源项目迎来重大更新,成功打破大模型推理算力门槛。

此次KTransformers项目更新带来重大突破,支持在24G显存(4090D)的设备上本地运行DeepSeek-R1、V3的671B满血版。

KTransformers项目的核心在于异构计算策略:稀疏性利用:MoE架构每次仅激活部分专家模块,团队将非共享的稀疏矩阵卸载至CPU内存,结合高速算子处理,显存占用压缩至24GB。

量化与算子优化:采用4bit量化技术,配合Marlin GPU算子,效率提升3.87倍;CPU端通过llamafile实现多线程并行,预处理速度高达286 tokens/s。

CUDA Graph加速:减少CPU/GPU通信开销,单次解码仅需一次完整的CUDA Graph调用,生成速度达14 tokens/s。

这带来了怎样的后果呢?传统方案:8卡A100服务器成本超百万,按需计费每小时数千元。

现在,单卡RTX 4090方案:整机成本约2万元,功耗80W,适合中小团队与个人开发者。

NVIDIA RTX 4090运行DeepSeek-R1满血版的案例,不仅是技术奇迹,更是开源精神与硬件潜能结合的典范。它证明:在AI狂飙的时代,创新往往源于对“不可能”的挑战。

技术奇迹!清华突破大模型算力难题 RTX 4090单枪匹马就能跑满血版DeepSeek

【本文结束】如需转载请务必注明出处:快科技

责任编辑:雪花

文章内容举报

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2025-02-15 14:45:06

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

梦想当“燃”|不断破局!这个浪潮青年团队如何让大模型实现“量身定制”
在从无到有的创新之路上,真正的突破从来不是单枪匹马的奇迹,而是并肩携手穿过一个又一个的荆棘。科技革命的星辰大海,永远属于那些既敢仰望星空、又能携手同行的开拓者。“浪潮青年五四奖章
2025-05-29 12:33:00
中国算力全球第二:“大力”如何出奇迹?
...)“大力出奇迹。”10月13日,中国工程院院士、CCF会士、清华大学计算机系教授郑纬民在2023世界数字经济大会暨第十三届智慧城市与智能经济博览会主论坛上表示,中国算力位居全
2023-10-13 20:58:00
清华大学获芯片领域重要突破!
来源:极目新闻科技日报记者华凌记者11日从清华大学获悉,针对大规模光电智能计算难题,清华大学电子工程系副教授方璐课题组、自动化系戴琼海院士课题组,摒弃传统电子深度计算范式,另辟蹊
2024-04-12 10:19:00
边缘大模型狂飙落地!清华系GPGPU惊艳WAIC,解读“六边形战士”处理器
...署背后的一个关键角色就是底层芯片玩家。WAIC上,一家清华系GPGPU创企的展台上,我们看到其AI加速卡AzureBlade K340l已经可以支撑大模型跑在AI PC等设备上
2024-07-08 09:58:00
同一天2篇Nature!清华两团队最新科研突破!
北京时间5月30日清华大学2项最新科研成果同时发表于《自然》(Nature)清华大学依托精密仪器系的类脑计算研究中心施路平教授团队提出一种基于视觉原语的互补双通路类脑视觉感知新范
2024-05-30 09:46:00
清华团队提出新型光计算架构,光训练速度提升1个数量级
近期,清华大学电子工程系方璐教授课题组、自动化系戴琼海教授课题组创新性地设计了全前向智能光计算训练架构,开发出一种名为“太极-II”的通用光训练芯片。该架构摆脱了对电计算离线训练
2024-08-09 09:57:00
清华量子计算成果登顶刊,来自丘成桐数学中心团队
...领域首次发现!噪声会造成量子优势突然消亡。这是来自清华大学丘成桐数学科学中心助理教授魏朝晖团队的最新研究成果,刚刚登上Science子刊。(相关成果以“关联生成中量子优势的突
2024-11-28 12:04:00
光电融合新突破!清华大学建立光电智能计算架构—ACCEL芯片
据清华大学消息,近日,清华大学自动化系戴琼海院士、吴嘉敏助理教授与电子工程系方璐副教授、乔飞副研究员联合攻关,提出一种“挣脱摩尔定律的新型智能计算架构”——ACCEL全模拟光电智
2023-11-05 13:34:00
...呈现省内外48所国内顶尖学府的351项尖端科技成果。比如清华大学全球首发的“猛狮第三代飞行汽车”,突破了大载重下飞行汽车运输距离受限的技术难题、突破了传统车辆与飞行器的耦合模
2025-04-24 19:00:00
更多关于科技的资讯:
科学探秘 巧手求真 观湖社区伯努利实验点亮青少年科学梦
“原来流动的空气真的有力量!”“乒乓球居然能悬浮在空中不掉下来!”近日,苏州工业园区唯亭街道观湖社区阿里博士实验室内欢呼声此起彼伏
2026-01-29 11:28:00
大皖新闻讯 1月28日晚间,星巴克发布2026财年第一季度业绩报告,中国市场延续强劲增长势头,营收实现双位数增长,同店销售额连续三个季度正增长
2026-01-29 12:51:00
京东携机器人亮相乡村舞台 光明村首届“村晚”科技感拉满
当智能机器人遇上“村晚”,科技与年味会碰撞出怎样的精彩?1月28日,江苏宿迁来龙镇光明村热闹非凡,由京东打造的首届“村晚”正式上演
2026-01-29 13:13:00
“溪山模式+溪有物种实践”赋能科创:从商业航天到核聚变
2026年1月22日,NSE2026第四届新物种进化大会暨2026溪山天使年会在北京大北农凤凰国际创新园隆重举行。这场由溪山天使汇
2026-01-29 13:14:00
爱喏与宅智造达成战略合作:融合产品体系与服务网络,打造高效家装新平台
近日,融合产品设计与实用美学的健康水生态品牌“爱喏”与国内领先的一站式建材服务商“宅智造”建材超市正式签署战略合作协议
2026-01-29 13:16:00
第五届青山科技奖出炉:聚焦“数字+绿色”,鼓励基础科研“更落地”
1月29日,第五届青山科技奖获奖名单正式揭晓,10位绿色低碳领域的青年科学家入选。获奖名单中首次出现两名“95后”科学家
2026-01-29 13:33:00
海外网1月29日电 据美国广播公司报道,亚马逊公司高级副总裁贝丝·加莱蒂(Beth Galetti)在给员工的电子邮件中表示
2026-01-29 13:33:00
从人力巡防到智能巡护:云深处科技机器狗重新定义园区安全
如今,具身智能技术加速渗透千行百业,凭借与环境的实时交互能力,高效完成各类复杂任务,成为推动各领域智能化转型的关键驱动力
2026-01-29 13:14:00
鲁网1月28日讯走进泰安斯耐特自动化设备有限公司的研发中心与生产车间,科研人员正专注调试高压电气设备智能监测系统,生产线上智能组装设备高效运转
2026-01-29 09:05:00
中国科大构建全球首个核自旋量子传感网络 为搜寻宇宙“隐形邻居”提供工具
大皖新闻讯 近日,中国科大自旋磁共振实验室彭新华教授和江敏教授团队在《自然》杂志发表突破性研究成果:团队革新核自旋量子精密测量技术
2026-01-29 09:26:00
■ 胡蓉摘要:在数字经济快速发展的背景下,营销活动的数字化、智能化和平台化已成为企业提升市场竞争力的重要途径。相较于民营企业和互联网企业
2026-01-29 04:48:00
探店1天|“两个月投入8000元”,年轻人迷上花滑,啥情况?
中新经纬1月28日电 (李自曼)“重心往下,感觉你的刀刃!起身,张开双臂保持平衡……”在冰场中央,花滑教练王子誊一边说着
2026-01-28 23:33:00
江南时报讯 2025年,泰州农商银行秉持“以客户为中心”的理念,深入开展“运营服务满意年”专项活动,以创新驱动、网点提质
2026-01-28 21:53:00
山东移动日照分公司圆满完成2025年银行金融跨年结算通信保障工作
鲁网1月28日讯近日,日照移动公司全力组织人员保障网络工作,顺利完成市县银行系统52家网点的网络保驾护航工作,圆满完成网络通信保障
2026-01-28 22:01:00
科技赋能传统酿造 引领产业数智变革——中科恒信人工智能上甑机器人及发酵食品高端装备项目投产
鲁网1月28日讯近日,记者走进中科恒信智能科技(泰安)有限公司人工智能上甑机器人及发酵食品高端装备项目的智能装备车间,大族激光切割机精准作业
2026-01-28 17:21:00