• 我的订阅
  • 科技

技术奇迹!清华突破大模型算力难题 RTX 4090单枪匹马就能跑满血版DeepSeek

类别:科技 发布时间:2025-02-15 10:52:00 来源:浅语科技

快科技2月15日消息,清华团队突破大模型算力难题,这让英伟达情何以堪。

据国内媒体报道称,清华大学KVCache.AI团队联合趋境科技发布的KTransformers开源项目迎来重大更新,成功打破大模型推理算力门槛。

此次KTransformers项目更新带来重大突破,支持在24G显存(4090D)的设备上本地运行DeepSeek-R1、V3的671B满血版。

KTransformers项目的核心在于异构计算策略:稀疏性利用:MoE架构每次仅激活部分专家模块,团队将非共享的稀疏矩阵卸载至CPU内存,结合高速算子处理,显存占用压缩至24GB。

量化与算子优化:采用4bit量化技术,配合Marlin GPU算子,效率提升3.87倍;CPU端通过llamafile实现多线程并行,预处理速度高达286 tokens/s。

CUDA Graph加速:减少CPU/GPU通信开销,单次解码仅需一次完整的CUDA Graph调用,生成速度达14 tokens/s。

这带来了怎样的后果呢?传统方案:8卡A100服务器成本超百万,按需计费每小时数千元。

现在,单卡RTX 4090方案:整机成本约2万元,功耗80W,适合中小团队与个人开发者。

NVIDIA RTX 4090运行DeepSeek-R1满血版的案例,不仅是技术奇迹,更是开源精神与硬件潜能结合的典范。它证明:在AI狂飙的时代,创新往往源于对“不可能”的挑战。

技术奇迹!清华突破大模型算力难题 RTX 4090单枪匹马就能跑满血版DeepSeek

【本文结束】如需转载请务必注明出处:快科技

责任编辑:雪花

文章内容举报

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2025-02-15 14:45:06

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

梦想当“燃”|不断破局!这个浪潮青年团队如何让大模型实现“量身定制”
在从无到有的创新之路上,真正的突破从来不是单枪匹马的奇迹,而是并肩携手穿过一个又一个的荆棘。科技革命的星辰大海,永远属于那些既敢仰望星空、又能携手同行的开拓者。“浪潮青年五四奖章
2025-05-29 12:33:00
中国算力全球第二:“大力”如何出奇迹?
...)“大力出奇迹。”10月13日,中国工程院院士、CCF会士、清华大学计算机系教授郑纬民在2023世界数字经济大会暨第十三届智慧城市与智能经济博览会主论坛上表示,中国算力位居全
2023-10-13 20:58:00
清华大学获芯片领域重要突破!
来源:极目新闻科技日报记者华凌记者11日从清华大学获悉,针对大规模光电智能计算难题,清华大学电子工程系副教授方璐课题组、自动化系戴琼海院士课题组,摒弃传统电子深度计算范式,另辟蹊
2024-04-12 10:19:00
边缘大模型狂飙落地!清华系GPGPU惊艳WAIC,解读“六边形战士”处理器
...署背后的一个关键角色就是底层芯片玩家。WAIC上,一家清华系GPGPU创企的展台上,我们看到其AI加速卡AzureBlade K340l已经可以支撑大模型跑在AI PC等设备上
2024-07-08 09:58:00
同一天2篇Nature!清华两团队最新科研突破!
北京时间5月30日清华大学2项最新科研成果同时发表于《自然》(Nature)清华大学依托精密仪器系的类脑计算研究中心施路平教授团队提出一种基于视觉原语的互补双通路类脑视觉感知新范
2024-05-30 09:46:00
清华团队提出新型光计算架构,光训练速度提升1个数量级
近期,清华大学电子工程系方璐教授课题组、自动化系戴琼海教授课题组创新性地设计了全前向智能光计算训练架构,开发出一种名为“太极-II”的通用光训练芯片。该架构摆脱了对电计算离线训练
2024-08-09 09:57:00
清华量子计算成果登顶刊,来自丘成桐数学中心团队
...领域首次发现!噪声会造成量子优势突然消亡。这是来自清华大学丘成桐数学科学中心助理教授魏朝晖团队的最新研究成果,刚刚登上Science子刊。(相关成果以“关联生成中量子优势的突
2024-11-28 12:04:00
光电融合新突破!清华大学建立光电智能计算架构—ACCEL芯片
据清华大学消息,近日,清华大学自动化系戴琼海院士、吴嘉敏助理教授与电子工程系方璐副教授、乔飞副研究员联合攻关,提出一种“挣脱摩尔定律的新型智能计算架构”——ACCEL全模拟光电智
2023-11-05 13:34:00
...呈现省内外48所国内顶尖学府的351项尖端科技成果。比如清华大学全球首发的“猛狮第三代飞行汽车”,突破了大载重下飞行汽车运输距离受限的技术难题、突破了传统车辆与飞行器的耦合模
2025-04-24 19:00:00
更多关于科技的资讯:
“公交医生”用心守护 保障乘客畅行新春
随着新春的脚步日益临近,城市公交迎来了全年运营的高峰期。在保障车辆安全高效运转的链条上,车间维修团队是不可或缺的“技术核心”
2026-01-31 18:06:00
从赛事领奖台到春晚舞台,松延动力勾勒人形机器人产业新图景
1月29日,中央广播电视总台与松延动力联合宣布,松延动力成为总台《2026年春节联欢晚会》人形机器人合作伙伴。松延动力表示
2026-01-31 17:05:00
百度智能云:800多家金融机构的首选“AI搭子”
大模型在金融行业的落地节奏正在加快。1月31日消息,根据近期媒体对2025年公开市场大模型相关招投标信息的统计,金融行业全年大模型中标项目达587个
2026-01-31 17:05:00
高顿咨询财务进化论年度峰会暨AI白皮书重磅发布
高顿咨询财务进化论年度峰会暨AI白皮书发布会于2026年1月23日在上海隆重启幕。来自AI财务领域的学界专家、企业高管汇聚一堂
2026-01-31 17:06:00
导演王晶短剧公司落地河南 称今年要拍100部精品
大河网讯 近日,香港导演王晶现身郑州,为其担任总监制、总编剧的微短剧《澳城风云》主持开机仪式,标志其正式进军河南微短剧产业
2026-01-31 16:34:00
大润发东营首店亮相东城万达广场
鲁网1月31日讯2026年1月30日,大润发东营首店正式落户东营东城万达广场。该店践行“线上线下融合”的新零售战略,线上平台“大润发优鲜”已率先运营
2026-01-31 13:04:00
元梦空间2026马上元梦嘉年华大会即将在蓉举办,开启元宇宙“虚实共生”新纪元
2026年2月3日,一场以“马上元梦·数字新生”为主题的元宇宙行业盛典——元梦空间2026马上元梦嘉年华大会,将在四川成都隆重举行
2026-01-31 08:57:00
零基础学烘焙,2026年1月郑州靠谱的蛋糕培训机构有哪些?
想在郑州学做蛋糕,却不知道选哪家?是零基础想扎实学技能,还是打算创业需要全流程支持?随着烘焙赛道越来越火,郑州的蛋糕培训机构也层出不穷
2026-01-31 08:59:00
定制钻戒哪个好?2026年高性价比国产培育钻品牌深度推荐指南
在当代珠宝消费语境中,“定制钻戒”早已不再只是婚礼场景的专属符号,而逐渐演变为一种承载情感、表达个性与彰显审美的生活方式
2026-01-31 08:59:00
定制钻戒哪个好?2026培育钻戒选购终极攻略:这些高性价比品牌别错过!
在“悦己消费”与“情感表达”日益成为主流的今天,钻戒早已超越传统婚庆符号的单一身份,演变为一种融合科技、美学与个人叙事的现代生活方式
2026-01-31 09:01:00
简单解压易分享 我市涌现一批线下拼豆店
记者体验拼豆。拼豆店里,小朋友认真地将一粒粒塑料豆摆到豆板上。 厦门网讯 (文/图 厦门日报记者 柯笛)马年将至,小马造型和新年主题的拼豆图纸在网上走红
2026-01-31 09:16:00
东南网1月31日讯(福建日报记者 张文奎 通讯员 林文昊) 近日,记者从福州新区集团获悉,该集团投资企业恒美光电迎来重大技术突破
2026-01-31 10:34:00
行业无解的“-57密码”,他用国产元件成功“破解”
日前,一汽大众长春整车制造部总装二车间车身线的LJU控制器在运行过程中突然集中批量报出各种故障代码,其中的变频过流“-57”故障占比达到60%
2026-01-30 23:24:00
当国产航母劈波斩浪,北斗系统指引八方,医疗核心系统的自主可控之路同样刻不容缓。因为,看病靠医生,也靠信息保障,“健康钥匙”掌握在自己手里
2026-01-31 06:41:00