• 我的订阅
  • 科技

kimi开放平台contextcaching功能将启动内测

类别:科技 发布时间:2024-06-20 10:35:00 来源:浅语科技

6月19日消息,月之暗面官宣Kimi开放平台ContextCaching功能将启动内测,届时将支持长文本大模型,可实现上下文缓存功能。

kimi开放平台contextcaching功能将启动内测

▲图源Kimi开放平台官方公众号,下同

据介绍,ContextCaching(上下文缓存)是由Kimi开放平台提供的一项高级功能,可通过缓存重复的Tokens内容,降低用户在请求相同内容时的成本,原理如下:

kimi开放平台contextcaching功能将启动内测

官方表示,ContextCaching 可提升API的接口响应速度(或首字返回速度)。在规模化、重复度高的prompt场景,ContextCaching功能带来的收益越大。

ContextCaching适合于用频繁请求,重复引用大量初始上下文的情况,通过重用已缓存的内容,可提高效率降低费用,适用业务场景如下:

提供大量预设内容的QABot,例如KimiAPI小助手。

针对固定的文档集合的频繁查询,例如上市公司信息披露问答工具。

对静态代码库或知识库的周期性分析,例如各类CopilotAgent。

瞬时流量巨大的爆款AI应用,例如哄哄模拟器,LLMRiddles。

交互规则复杂的Agent类应用,例如什么值得买Kimi+等。

官方后续将发布ContextCaching功能的场景最佳实践/计费方案/技术文档

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-06-20 12:45:03

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

谷歌「诚意之作」,开源9B、27B版Gemma2,主打高效、经济!
...发者提供了前段时间在I/O大会上官宣的Gemini 1.5 Pro的200万上下文窗口访问权限、Gemini API的代码执行功能
2024-06-29 09:37:00
Mamba再次挑战霸主Transformer!首个通用Mamba开源大模型一鸣惊人
...有效地捕获其关系。这种通过比较文本中每个token来理解上下文的方式,需要更多的计算能力和内存来处理不断增长的上下文窗口。如果资源没有相应扩展,推理速度会变慢,最终无法处理超
2024-08-14 09:43:00
陈天奇团队LLM结构化生成新引擎XGrammar:百倍加速、近零开销
...就是遵循某个特定格式(如 JSON、SQL 等)的数据。但使用上下文无关语法(CFG)来进行约束解码的方法并不高效
2024-11-27 13:37:00
技术解读: vCPU 从 SMP 走向 Hybrid
...可以同时出现母机和子机中,核心思路是基于当前任务的上下文在下一次调度决策前更新其调度上下文。它需要实现特性匹配,在主机侧需要用一种通用的方式完成 vCPU 与 pCPU 的灵
2023-06-30 11:01:00
CMU副教授:在多智能体流行的当下,不要忽视单智能体系统
...完全匹配时,效果会很好,但问题是如果不匹配怎么办?上下文信息的传递:多智能体系统通常在多个智能体之间传递信息,但这可能是信息丢失的原因。例如,如果故障定位器仅将其摘要信息传递
2024-10-11 12:03:00
高德发布MCP Server2.0,已整合12大核心接口
...r(以下简称“高德MCP”)基于MCP(ModelContextProtocol,模型上下文协议)构建,是一个标准化地图服务能力平台
2025-04-30 19:21:00
rtxai助手的进化
...Assist项目可接收玩家的语音或文字输入内容,游戏窗口的上下文信息,并通过AI视觉模型处理数据。这些模型增强了与游戏知识数据库相连的大语言模型(LLM)的上下文感知和对特定
2024-06-07 04:47:00
Kimi爆火出圈,国产大模型首次超越海外!
2024年3月18日,国产AI大模型Kimi将上下文无损输入长度提升至200万字,成为国内大模型首次在部分能力上超越海外主流产品的里程碑。上下文输入长度的增加能够帮助模型更好学习
2024-04-02 18:31:00
Anthropic开源MCP:大模型接入数据有了“统一插头”,Agent平台慌了?
...Slack、GitHub等平台的数据了。近日,Anthropic开源了“模型上下文协议”(MCP),该协议将大模型直接连接至数据源
2024-11-27 13:33:00
更多关于科技的资讯:
新闻纵深|订单旅行记⑤:一个品牌的抱团突围
一个品牌的抱团突围——订单旅行记⑤■阅读提示玉田,素有“中国印刷机械之乡”的美誉。然而,这个国内市场占有率超20%的印机产业集群
2026-04-17 08:05:00
一线见闻|AI面试舱 求职新体验
4月2日9时许,唐山市民服务中心人力资源交流大厅内人头攒动,唐山市综合招聘会正在进行。众多展位中,一座外观简洁的AI面试舱凭借智能高效
2026-04-17 08:08:00
斐纳LT-2309助听器 高清降噪 精准助听
对于许多有轻度至中度听力困扰的朋友来说,选择一款合适的助听器并非易事。市场上品牌众多,从国际一线到国产品牌,价格和性能差异巨大
2026-04-17 08:17:00
厦门网讯(厦门日报记者 吴君宁)近日,嘉庚创新实验室联合华为发布《智能实验室发展报告》,同步启用物质科学智能算力平台。这标志着我国在能源材料科研领域拥有了首个软硬自主创新的智能算力基础设施
2026-04-17 08:26:00
在第26个“世界知识产权日”来临之际,4月14日,省高院启动知识产权司法保护宣传周活动,通报2025年浙江知识产权司法保护情况
2026-04-17 08:40:00
全能全域 智富王者 | 潍柴雷沃2026款玉米机上市暨节油减损指标发布会举行
鲁网4月16日讯4月15日,以“全能全域 智富王者”为主题的潍柴雷沃智慧农业2026款玉米收获机械新品上市暨节油减损指标发布会在山东潍坊举行
2026-04-17 09:27:00
加速“出海” | 潍柴雷沃智慧农业亮相第139届广交会
鲁网4月16日讯4月15日,第139届广交会在广州启幕。潍柴雷沃智慧农业多款智能农机亮相现场,向全球客商展现中国农机智造助力世界粮食安全的硬核实力
2026-04-17 09:30:00
在人工智能浪潮席卷全球、传统高等教育模式面临深刻变革的当下,吉利控股集团和芯位科技共同宣布启动“跨时代跃迁人才培养计划”
2026-04-17 09:43:00
“十五五”开局看河北|邯郸工业品,直播间里闯市场
车间变身云展厅 重卡也能“上链接”邯郸工业品,直播间里闯市场4月16日,宜邦机械科技(邯郸市)有限公司主播正在讲解紧固件产品
2026-04-17 08:04:00
当AI成为最可靠的“合伙人”,一个人也能掀起创业浪潮。随着人工智能技术的飞速发展,一种以“单人+AI工具”为核心运营模式的新型创业形态——一人公司(One Person Company
2026-04-17 07:09:00
4月15日至17日,以“服务提质”为主题的第二十六届中国零售业博览会(2026 CHINASHOP)在杭州大会展中心举办
2026-04-17 07:39:00
英特尔全球高管来杭 专程到上城喝了一杯咖啡
AlphaBot机器人正在制作咖啡4月15日下午,上城区丁兰街道西子智慧产业园迎来了英特尔全球高管一行。他们进门的第一件事
2026-04-17 07:39:00
昨天,杭州市余杭区和临平区初三年级第一次模拟考试举行。上午,语文学科先进行了测试。上午11点考试结束后,作文题目出炉:写作交流活动(50分)阅读下面材料
2026-04-17 07:39:00
眼下,杭州OPC(一人公司)创业者数量持续增长,但普遍面临诸多难题。比如缺乏固定经营场所导致准入门槛高,技术或创意出身的创业者对合规经营
2026-04-17 07:39:00
4月16日,阿里巴巴发布可实时构建和交互的世界模型产品HappyOyster(快乐生蚝)。该模型基于原生多模态架构而建
2026-04-17 07:39:00