• 我的订阅
  • 科技

kimi开放平台contextcaching功能将启动内测

类别:科技 发布时间:2024-06-20 10:35:00 来源:浅语科技

6月19日消息,月之暗面官宣Kimi开放平台ContextCaching功能将启动内测,届时将支持长文本大模型,可实现上下文缓存功能。

kimi开放平台contextcaching功能将启动内测

▲图源Kimi开放平台官方公众号,下同

据介绍,ContextCaching(上下文缓存)是由Kimi开放平台提供的一项高级功能,可通过缓存重复的Tokens内容,降低用户在请求相同内容时的成本,原理如下:

kimi开放平台contextcaching功能将启动内测

官方表示,ContextCaching 可提升API的接口响应速度(或首字返回速度)。在规模化、重复度高的prompt场景,ContextCaching功能带来的收益越大。

ContextCaching适合于用频繁请求,重复引用大量初始上下文的情况,通过重用已缓存的内容,可提高效率降低费用,适用业务场景如下:

提供大量预设内容的QABot,例如KimiAPI小助手。

针对固定的文档集合的频繁查询,例如上市公司信息披露问答工具。

对静态代码库或知识库的周期性分析,例如各类CopilotAgent。

瞬时流量巨大的爆款AI应用,例如哄哄模拟器,LLMRiddles。

交互规则复杂的Agent类应用,例如什么值得买Kimi+等。

官方后续将发布ContextCaching功能的场景最佳实践/计费方案/技术文档

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-06-20 12:45:03

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

谷歌「诚意之作」,开源9B、27B版Gemma2,主打高效、经济!
...发者提供了前段时间在I/O大会上官宣的Gemini 1.5 Pro的200万上下文窗口访问权限、Gemini API的代码执行功能
2024-06-29 09:37:00
Mamba再次挑战霸主Transformer!首个通用Mamba开源大模型一鸣惊人
...有效地捕获其关系。这种通过比较文本中每个token来理解上下文的方式,需要更多的计算能力和内存来处理不断增长的上下文窗口。如果资源没有相应扩展,推理速度会变慢,最终无法处理超
2024-08-14 09:43:00
陈天奇团队LLM结构化生成新引擎XGrammar:百倍加速、近零开销
...就是遵循某个特定格式(如 JSON、SQL 等)的数据。但使用上下文无关语法(CFG)来进行约束解码的方法并不高效
2024-11-27 13:37:00
技术解读: vCPU 从 SMP 走向 Hybrid
...可以同时出现母机和子机中,核心思路是基于当前任务的上下文在下一次调度决策前更新其调度上下文。它需要实现特性匹配,在主机侧需要用一种通用的方式完成 vCPU 与 pCPU 的灵
2023-06-30 11:01:00
高德发布MCP Server2.0,已整合12大核心接口
...r(以下简称“高德MCP”)基于MCP(ModelContextProtocol,模型上下文协议)构建,是一个标准化地图服务能力平台
2025-04-30 19:21:00
CMU副教授:在多智能体流行的当下,不要忽视单智能体系统
...完全匹配时,效果会很好,但问题是如果不匹配怎么办?上下文信息的传递:多智能体系统通常在多个智能体之间传递信息,但这可能是信息丢失的原因。例如,如果故障定位器仅将其摘要信息传递
2024-10-11 12:03:00
rtxai助手的进化
...Assist项目可接收玩家的语音或文字输入内容,游戏窗口的上下文信息,并通过AI视觉模型处理数据。这些模型增强了与游戏知识数据库相连的大语言模型(LLM)的上下文感知和对特定
2024-06-07 04:47:00
Anthropic开源MCP:大模型接入数据有了“统一插头”,Agent平台慌了?
...Slack、GitHub等平台的数据了。近日,Anthropic开源了“模型上下文协议”(MCP),该协议将大模型直接连接至数据源
2024-11-27 13:33:00
Kimi爆火出圈,国产大模型首次超越海外!
2024年3月18日,国产AI大模型Kimi将上下文无损输入长度提升至200万字,成为国内大模型首次在部分能力上超越海外主流产品的里程碑。上下文输入长度的增加能够帮助模型更好学习
2024-04-02 18:31:00
更多关于科技的资讯:
9月10日,在“以创新激发消费潜能,平台企业大有可为”的线上论坛中,中国中小企业协会专职副会长朱玉、中国社会科学院数量经济与技术经济研究所副所长蔡跃洲都充分肯定新发布的高德扫街榜
2025-09-11 13:25:00
9月9日,YouthPick全球青年优选榜正式启动,该活动由欧亚商业联盟及 BlueHorse Hub(蓝马共创中心)主办
2025-09-11 13:25:00
国产高端主控芯片模组厂在江北新区投产固态硬盘“大脑”,南京造!南报网讯(通讯员胡晓靓记者夏思宇)身处数字化时代,固态硬盘(SSD)是掌握系统运行速度
2025-09-11 08:50:00
8个月引来24个项目,建邺招商“亿”军突起9月,德国奥乐齐首进南京建区域总部□南京日报/紫金山新闻记者 卫凌云 通讯员建投宣招商热潮涌
2025-09-11 07:44:00
南瑞继保发挥“头雁效应”,带领全产业链跑出中国智能电网自主创新路让产业链“筋骨”更壮“血脉”更通□南京日报/紫金山新闻记者黄琳燕国网湖南衡阳站
2025-09-11 07:44:00
近30家赣企参展投洽会 江西前沿科技亮绝活
本报讯 全媒体记者陈春伟报道:9月8日至9月11日,第二十五届中国国际投资贸易洽谈会(简称“投洽会”)在福建厦门举行。江西组织近30家优质企业参展
2025-09-11 06:36:00
2025服贸会丨走进贵州展区 一睹服贸“新”风采
2025年中国国际服务贸易交易会(简称“服贸会”)于9月10日至14日在北京首钢园区举办。其间,贵州将以“开放贵州,创新服贸”为主题设立展区
2025-09-11 03:24:00
烟台高新区多家企业入围第十届“创客中国”时空信息大赛决赛
胶东在线9月9日讯(通讯员 郭健)近日,由工业和信息化部网络安全产业发展中心(工业和信息化部信息中心)、北京市经济和信息化局联合主办
2025-09-11 03:03:00
8月28日,秦皇岛市海港区阿尔勃特空间智能(河北)视觉技术有限公司展示区,公司副总经理朱晓明用语音进行操作,要求机器人“鲁班1号”打好对应工位的螺丝
2025-09-10 08:27:00
第六届中国人工智能大赛在厦启动 描绘“数实融合”新图景
扫码了解详情厦门网讯(厦门日报全媒体记者 翁华鸿)在生成式人工智能持续迭代演进、与实体经济深度融合的背景下,一场高规格的人工智能盛会再度在厦门启航
2025-09-10 08:27:00
上海人工智能实验室主任、首席科学家周伯文:“人工智能+供应链”创新成果将在厦涌现
周伯文。(厦门日报全媒体记者 王火炎 摄)厦门正在全力推进国家人工智能应用中试基地建设,一批“人工智能+供应链”的创新成果有望在此加速涌现
2025-09-10 08:58:00
随着中报陆续披露,在今年国内医疗器械行业普遍承压的大环境下,鱼跃医疗交出了一份营收、净利双增的亮眼答卷,其中海外业务同比增长26
2025-09-10 09:17:00
上海时尚之都的形象深入人心,时装之外,上海还是一座美妆之城。今年8月,胡润研究院发布《2025 CBE·胡润中国彩妆品牌TOP50》报告
2025-09-10 10:55:00
当消费市场从规模竞赛转向价值深耕时,一场以民生需求为罗盘的产业变革正加速演进。国家统计局日前发布的数据显示,今年1—7月
2025-09-10 10:55:00
青岛锐智智能装备科技股份有限公司:科技创新引领高质量发展
鲁网9月10日讯(记者 葛万彩)在国际国内市场竞争异常激烈的形势下,青岛锐智智能装备科技股份有限公司靠科技人员自主研发
2025-09-10 11:20:00