• 我的订阅
  • 科技

技术奇迹!清华突破大模型算力难题 RTX 4090单枪匹马就能跑满血版DeepSeek

类别:科技 发布时间:2025-02-15 10:52:00 来源:浅语科技

快科技2月15日消息,清华团队突破大模型算力难题,这让英伟达情何以堪。

据国内媒体报道称,清华大学KVCache.AI团队联合趋境科技发布的KTransformers开源项目迎来重大更新,成功打破大模型推理算力门槛。

此次KTransformers项目更新带来重大突破,支持在24G显存(4090D)的设备上本地运行DeepSeek-R1、V3的671B满血版。

KTransformers项目的核心在于异构计算策略:稀疏性利用:MoE架构每次仅激活部分专家模块,团队将非共享的稀疏矩阵卸载至CPU内存,结合高速算子处理,显存占用压缩至24GB。

量化与算子优化:采用4bit量化技术,配合Marlin GPU算子,效率提升3.87倍;CPU端通过llamafile实现多线程并行,预处理速度高达286 tokens/s。

CUDA Graph加速:减少CPU/GPU通信开销,单次解码仅需一次完整的CUDA Graph调用,生成速度达14 tokens/s。

这带来了怎样的后果呢?传统方案:8卡A100服务器成本超百万,按需计费每小时数千元。

现在,单卡RTX 4090方案:整机成本约2万元,功耗80W,适合中小团队与个人开发者。

NVIDIA RTX 4090运行DeepSeek-R1满血版的案例,不仅是技术奇迹,更是开源精神与硬件潜能结合的典范。它证明:在AI狂飙的时代,创新往往源于对“不可能”的挑战。

技术奇迹!清华突破大模型算力难题 RTX 4090单枪匹马就能跑满血版DeepSeek

【本文结束】如需转载请务必注明出处:快科技

责任编辑:雪花

文章内容举报

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2025-02-15 14:45:06

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

梦想当“燃”|不断破局!这个浪潮青年团队如何让大模型实现“量身定制”
在从无到有的创新之路上,真正的突破从来不是单枪匹马的奇迹,而是并肩携手穿过一个又一个的荆棘。科技革命的星辰大海,永远属于那些既敢仰望星空、又能携手同行的开拓者。“浪潮青年五四奖章
2025-05-29 12:33:00
中国算力全球第二:“大力”如何出奇迹?
...)“大力出奇迹。”10月13日,中国工程院院士、CCF会士、清华大学计算机系教授郑纬民在2023世界数字经济大会暨第十三届智慧城市与智能经济博览会主论坛上表示,中国算力位居全
2023-10-13 20:58:00
清华大学获芯片领域重要突破!
来源:极目新闻科技日报记者华凌记者11日从清华大学获悉,针对大规模光电智能计算难题,清华大学电子工程系副教授方璐课题组、自动化系戴琼海院士课题组,摒弃传统电子深度计算范式,另辟蹊
2024-04-12 10:19:00
边缘大模型狂飙落地!清华系GPGPU惊艳WAIC,解读“六边形战士”处理器
...署背后的一个关键角色就是底层芯片玩家。WAIC上,一家清华系GPGPU创企的展台上,我们看到其AI加速卡AzureBlade K340l已经可以支撑大模型跑在AI PC等设备上
2024-07-08 09:58:00
同一天2篇Nature!清华两团队最新科研突破!
北京时间5月30日清华大学2项最新科研成果同时发表于《自然》(Nature)清华大学依托精密仪器系的类脑计算研究中心施路平教授团队提出一种基于视觉原语的互补双通路类脑视觉感知新范
2024-05-30 09:46:00
清华团队提出新型光计算架构,光训练速度提升1个数量级
近期,清华大学电子工程系方璐教授课题组、自动化系戴琼海教授课题组创新性地设计了全前向智能光计算训练架构,开发出一种名为“太极-II”的通用光训练芯片。该架构摆脱了对电计算离线训练
2024-08-09 09:57:00
清华量子计算成果登顶刊,来自丘成桐数学中心团队
...领域首次发现!噪声会造成量子优势突然消亡。这是来自清华大学丘成桐数学科学中心助理教授魏朝晖团队的最新研究成果,刚刚登上Science子刊。(相关成果以“关联生成中量子优势的突
2024-11-28 12:04:00
光电融合新突破!清华大学建立光电智能计算架构—ACCEL芯片
据清华大学消息,近日,清华大学自动化系戴琼海院士、吴嘉敏助理教授与电子工程系方璐副教授、乔飞副研究员联合攻关,提出一种“挣脱摩尔定律的新型智能计算架构”——ACCEL全模拟光电智
2023-11-05 13:34:00
...呈现省内外48所国内顶尖学府的351项尖端科技成果。比如清华大学全球首发的“猛狮第三代飞行汽车”,突破了大载重下飞行汽车运输距离受限的技术难题、突破了传统车辆与飞行器的耦合模
2025-04-24 19:00:00
更多关于科技的资讯:
风暴降临!阿迪达斯轻机甲老爹鞋XLG STORM「机甲风暴」迭代登场!
在adidas Sportswear未来实验室的能量风暴场,轻机甲老爹鞋XLG STORM「机甲风暴」破界诞生。作为初代轻机甲鞋XLG RUNNER的全新迭代之作
2025-08-04 20:40:00
日丰管:以标杆品质与全球视野,铸就中国家装管道领军品牌
近日,由范志毅演绎的“日丰管,管用五十年”巨幅广告,在全国数个高铁站亮相,引得不少旅客驻足。此次携手合作,是两位同样以专业立身的行业领军者的强强联合
2025-08-04 20:45:00
近期,易观发布《中国第三方支付行业年度分析报告2025》(以下简称“报告),报告对中国第三方支付行业当前的发展现状及趋势进行了分析及洞察
2025-08-04 20:45:00
京东再迎国际品牌入驻 IKEA宜家家居京东官方旗舰店开业
8月4日,京东与全球知名家具及家居用品品牌宜家家居达成合作,正式开启IKEA宜家家居京东官方旗舰店,并将于8月8日盛大开业
2025-08-04 11:14:00
考拉悠然:以多模态大模型为基 深耕工业检测赋能产业升级
消费日报网讯(记者 冯举)在人工智能技术加速渗透实体经济的浪潮中,四川省的成都考拉悠然科技有限公司(简称“考拉悠然”)正以“技术突破+行业落地”的双轮驱动模式
2025-08-04 14:04:00
天津市优秀基层理论宣讲员风采展示
2025-08-04 14:31:00
天津市优秀基层理论宣讲员风采展示
2025-08-04 14:34:00
国网济宁供电公司:率先实现小型无人机可靠安装配电线路故障指示器
鲁网8月4日讯近日,国网济宁供电公司工作人员在10千伏塔安I线服装城分支1号杆塔开展无人机安装配电线路故障指示器实验,取得圆满成功
2025-08-04 14:41:00
Arduino AI助手中国首秀!欧时RS创客沙龙开启开源智能未来
近日,电子元件和工业品数字化全球供应商欧时RS联合四方维(Supplyframe)创新中心成功举办 "欧时RS创客沙龙——Arduino主题开放日"
2025-08-04 14:59:00
槐荫首家苏宁易购Pro超级旗舰国融大厦店8月8日盛大开业
坐镇济南城市西兴战略核心,城投重点打造的商业标杆项目——槐荫首家苏宁易购Pro超级旗舰国融大厦店,将于8月8日盛大开业
2025-08-04 15:01:00
“沪企通”政策大模型亮相2025世界人工智能大会,数喆数据联合上海数据集团打造AI政务新标杆
7月26日,2025世界人工智能大会暨人工智能全球治理高级别会议在上海开幕。大会期间,由上海数喆数据科技股份有限公司与上海数据集团联合打造的“沪企通”政策大模型正式发布
2025-08-04 15:17:00
在当今经济环境中,贷款已成为企业和个人解决资金周转问题的重要手段。无论是企业扩大经营规模,还是个人应对突发状况,贷款都能提供有力支持
2025-08-04 15:17:00
润人生荣膺多项殊荣!凭科技创新开启健康饮酒新风尚
在全民健康意识全面觉醒的当下,养生消费市场正迎来爆发式增长。其中,人参酒凭借其独特的滋补价值与饮酒体验的完美融合,正成为中产家庭酒柜中的新宠
2025-08-04 15:20:00
镜合设计创始人、设计总监朱云锋人物访谈
[导读]朱老师认为,设计师需要不断提升自己,才能适应时代,给予客户优质的设计方案。随着经济的发展、网络的普及,人们对装修的认知越来越深入
2025-08-04 15:29:00
当深圳某跨境电商企业财务总监李女士按下回车键,一笔涉及3个币种、5家银行的跨境支付指令瞬间发出,系统显示“交易完成”时
2025-08-04 15:34:00