• 我的订阅
  • 科技

月之暗面 Kimi 联合清华大学等开源大模型推理架构 Mooncake

类别:科技 发布时间:2024-11-29 09:22:00 来源:IT之家

IT之家 11 月 28 日消息,月之暗面 Kimi 和清华大学 MADSys 实验室 2024 年 6 月联合发布了 Kimi 底层的 Mooncake 推理系统设计方案。该系统基于以 KVCache 为中心的 PD 分离和以存换算架构,提升了推理吞吐量。

月之暗面 Kimi 联合清华大学等开源大模型推理架构 Mooncake

近日,为了进一步加速该技术框架的应用与推广,月之暗面 Kimi 和清华大学 MADSys 实验室联合 9#AISoft、阿里云、华为存储、面壁智能、趋境科技等共同发布开源项目 Mooncake,共建以 KVCache 为中心的大模型推理架构。

11 月 28 日,Mooncake 技术框架已开源上线,IT之家附地址如下:

月之暗面 Kimi 联合清华大学等开源大模型推理架构 Mooncake

据介绍,Mooncake 开源项目从论文延伸,以超大规模 KVCache 缓存池为中心,通过以存换算的创新理念大幅度减少算力开销,提升了推理吞吐量。

本次开源将采用分阶段的方式,逐步开源高性能 KVCache 多级缓存 Mooncake Store 的实现,同时针对各类推理引擎和底层存储 / 传输资源进行兼容。其中传输引擎 Transfer Engine 部分现在已经在 GitHub 全球开源。

Mooncake 开源项目的最终目标是,为大模型时代打造一种新型高性能内存语义存储的标准接口,并提供参考实现方案。

月之暗面 Kimi 联合清华大学等开源大模型推理架构 Mooncake

Mooncake 推理系统架构图

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-11-29 12:45:01

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

清华团队开源大模型推理引擎“赤兔Chitu”:硬件成本削减50%
快科技3月14日消息,据报道,清华大学高性能计算研究所翟季冬教授团队与清华系科创企业清程极智联合宣布,开源大模型推理引擎“赤兔Chitu”。这一突破性技术为国产AI芯片的广泛应用
2025-03-14 17:22:00
4090笔记本0.37秒直出大片!英伟达联手MIT清华祭出Sana架构,性能秒杀FLUX
...导读】一台4090笔记本,秒生1K质量高清图。英伟达联合MIT清华团队提出的Sana架构,得益于核心架构创新,具备了惊人的图像生成速度
2024-10-18 09:49:00
中国也有Sora同款训练架构公司,清华班底,智谱也投了 | 36氪首发
...服务和To C的应用产品。生数科技的核心团队成员,出自清华大学人工智能研究院。联合创始人兼CEO唐家渝出身清华大学自然语言处理实验室,曾任瑞莱只会副总裁、腾讯优图实验室高级产
2024-03-14 15:12:00
清华团队提出新型光计算架构,光训练速度提升1个数量级
近期,清华大学电子工程系方璐教授课题组、自动化系戴琼海教授课题组创新性地设计了全前向智能光计算训练架构,开发出一种名为“太极-II”的通用光训练芯片。该架构摆脱了对电计算离线训练
2024-08-09 09:57:00
5年投资超1000亿,北京公布一系列AI重磅成果,北大清华百度蚂蚁微软大佬齐谈AI未来|钛媒体AGI
...京大学教授、中国科学院院士鄂维南;中国工程院院士、清华大学信息科学技术学院院长戴琼海;百度CTO王海峰;蚂蚁集团CTO何征宇;微软全球资深副总裁、Microsoft AI亚太
2024-04-28 11:00:00
探索终端操作系统领域AI大模型创新趋势 OpenHarmony技术大会OS原生智能分论坛召开
...公司、深圳市若芯科技有限公司等企业界技术领袖和来自清华大学、上海交通大学等学术界专家学者分享了各自领域在OpenHarmony生态中结合AI大模型相关技术如何进行技术创新、突
2023-11-06 14:46:00
清华大学获芯片领域重要突破!
来源:极目新闻科技日报记者华凌记者11日从清华大学获悉,针对大规模光电智能计算难题,清华大学电子工程系副教授方璐课题组、自动化系戴琼海院士课题组,摒弃传统电子深度计算范式,另辟蹊
2024-04-12 10:19:00
清华团队提出大模型“密度定律”;足球领域首个视觉语言基础模型
...种扩展趋势正变得越来越不可持续。在这项工作中,来自清华大学和面壁智能的研究团队提出了“容量密度”(capacity density)的概念
2024-12-10 09:53:00
技术奇迹!清华突破大模型算力难题 RTX 4090单枪匹马就能跑满血版DeepSeek
...型算力难题,这让英伟达情何以堪。据国内媒体报道称,清华大学KVCache.AI团队联合趋境科技发布的KTransformers开源项目迎来重大更新
2025-02-15 10:52:00
更多关于科技的资讯:
铅山河红茶跨界融合再提速 传统名茶牵手现代饮品启新篇
.wordContentCss_17733677414731{ font-family:宋体; font-size:14pt
2026-03-13 11:05:00
厦门网讯(厦门日报记者 林露虹)抢抓具身智能产业发展机遇,厦门企业“握指成拳”。昨日,厦门具身智能产业联盟正式成立,联盟由九识智能
2026-03-13 08:29:00
一场汇聚全球好物的消费活动即将登陆杭州。3月15日至17日,“共享大市场·出口中国”之“浙里买全球·消费启杭”活动将在杭州国际博览中心(二期)举行
2026-03-13 09:04:00
山东联通发布OpenClaw安全服务一站式解决方案
鲁网3月13日讯近期,新一代AI智能体OpenClaw凭借全流程自动化任务处理能力迅速走红,成为推动数智化普惠应用的重要载体
2026-03-13 10:02:00
猫砂怎么选?五年累计销量榜首的耐威克绿茶猫砂给出答案
对于养猫家庭来说,挑选一款合适的猫砂是日常照顾中最重要的决策之一。面对市场上琳琅满目的商品,许多铲屎官都会在选购时产生疑问
2026-03-13 10:35:00
翟周近日,汾酒集团生产一线技术工人招聘拟录用名单引发热议,19名硕士研究生出现在酿酒工、成装工的拟录用名单中。“用铁锹摊晾
2026-03-13 10:49:00
清朗金融守权益 康养服务筑安心在"315金融消费者权益保护日"来临之际,中宏保险积极响应"清朗金融网络,守护安心消费"主题的号召
2026-03-13 10:49:00
以抹茶为突破口,武义有机茶销售掀起新热潮。去年,全县有机茶产业产值同比增长近30%,且全年的产量与产值双双位居浙江省各县第一
2026-03-13 08:34:00
龙岩武平新型显示产业全产业链营收突破百亿元大关
东南网龙岩3月12日讯(通讯员 陈荣香 谢思棋 兰秀连 黄玉兰 本网记者 马伊骅)一块小小显示屏,承载着县域产业转型的大梦想
2026-03-13 08:08:00
当国家级资本的“活水”遇上浙江数字贸易的“良田”,一场关于未来的激烈角逐正式启幕。3月12日,国家服务贸易创新发展引导基金二期(以下简称“服贸基金二期”)杭州项目路演会举行
2026-03-13 07:03:00
3月12日举行的国家服务贸易创新发展引导基金二期杭州项目路演会上,杭州融梦智能科技有限公司创始人钟张翼戴着自家研发的Dreamworld AI智能眼镜登场
2026-03-13 07:33:00
万典 南昌县银河学校摘要:计算能力是小学数学核心素养的重要组成部分。小学三、四年级是学生从简单加减向多位数乘除、小数和分数过渡的关键期
2026-03-13 07:34:00
3月9日,2026福布斯中国杰出商界女性100榜单发布,山西美锦能源股份有限公司董事、首席ESG官、氢能与可持续发展部总经理姚锦丽
2026-03-12 20:32:00
行舟清淤,一键搞定!西湖“黑科技”清淤船上线!
2026-03-12 22:49:00
江南时报讯 在数字化浪潮与客户需求多元化的时代,零售金融服务的核心正从单一产品交付转向深度场景融合与客群精细化运营。新沂农商银行始终坚持以客户为中心
2026-03-13 03:28:00