• 我的订阅
  • 科技

kimi开放平台contextcaching功能将启动内测

类别:科技 发布时间:2024-06-20 10:35:00 来源:浅语科技

6月19日消息,月之暗面官宣Kimi开放平台ContextCaching功能将启动内测,届时将支持长文本大模型,可实现上下文缓存功能。

kimi开放平台contextcaching功能将启动内测

▲图源Kimi开放平台官方公众号,下同

据介绍,ContextCaching(上下文缓存)是由Kimi开放平台提供的一项高级功能,可通过缓存重复的Tokens内容,降低用户在请求相同内容时的成本,原理如下:

kimi开放平台contextcaching功能将启动内测

官方表示,ContextCaching 可提升API的接口响应速度(或首字返回速度)。在规模化、重复度高的prompt场景,ContextCaching功能带来的收益越大。

ContextCaching适合于用频繁请求,重复引用大量初始上下文的情况,通过重用已缓存的内容,可提高效率降低费用,适用业务场景如下:

提供大量预设内容的QABot,例如KimiAPI小助手。

针对固定的文档集合的频繁查询,例如上市公司信息披露问答工具。

对静态代码库或知识库的周期性分析,例如各类CopilotAgent。

瞬时流量巨大的爆款AI应用,例如哄哄模拟器,LLMRiddles。

交互规则复杂的Agent类应用,例如什么值得买Kimi+等。

官方后续将发布ContextCaching功能的场景最佳实践/计费方案/技术文档

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-06-20 12:45:03

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

谷歌「诚意之作」,开源9B、27B版Gemma2,主打高效、经济!
...发者提供了前段时间在I/O大会上官宣的Gemini 1.5 Pro的200万上下文窗口访问权限、Gemini API的代码执行功能
2024-06-29 09:37:00
Mamba再次挑战霸主Transformer!首个通用Mamba开源大模型一鸣惊人
...有效地捕获其关系。这种通过比较文本中每个token来理解上下文的方式,需要更多的计算能力和内存来处理不断增长的上下文窗口。如果资源没有相应扩展,推理速度会变慢,最终无法处理超
2024-08-14 09:43:00
陈天奇团队LLM结构化生成新引擎XGrammar:百倍加速、近零开销
...就是遵循某个特定格式(如 JSON、SQL 等)的数据。但使用上下文无关语法(CFG)来进行约束解码的方法并不高效
2024-11-27 13:37:00
技术解读: vCPU 从 SMP 走向 Hybrid
...可以同时出现母机和子机中,核心思路是基于当前任务的上下文在下一次调度决策前更新其调度上下文。它需要实现特性匹配,在主机侧需要用一种通用的方式完成 vCPU 与 pCPU 的灵
2023-06-30 11:01:00
高德发布MCP Server2.0,已整合12大核心接口
...r(以下简称“高德MCP”)基于MCP(ModelContextProtocol,模型上下文协议)构建,是一个标准化地图服务能力平台
2025-04-30 19:21:00
CMU副教授:在多智能体流行的当下,不要忽视单智能体系统
...完全匹配时,效果会很好,但问题是如果不匹配怎么办?上下文信息的传递:多智能体系统通常在多个智能体之间传递信息,但这可能是信息丢失的原因。例如,如果故障定位器仅将其摘要信息传递
2024-10-11 12:03:00
rtxai助手的进化
...Assist项目可接收玩家的语音或文字输入内容,游戏窗口的上下文信息,并通过AI视觉模型处理数据。这些模型增强了与游戏知识数据库相连的大语言模型(LLM)的上下文感知和对特定
2024-06-07 04:47:00
Anthropic开源MCP:大模型接入数据有了“统一插头”,Agent平台慌了?
...Slack、GitHub等平台的数据了。近日,Anthropic开源了“模型上下文协议”(MCP),该协议将大模型直接连接至数据源
2024-11-27 13:33:00
Kimi爆火出圈,国产大模型首次超越海外!
2024年3月18日,国产AI大模型Kimi将上下文无损输入长度提升至200万字,成为国内大模型首次在部分能力上超越海外主流产品的里程碑。上下文输入长度的增加能够帮助模型更好学习
2024-04-02 18:31:00
更多关于科技的资讯:
脱口秀演员「炸现场」,喜剧综艺「炸市场」
伴随《喜剧之王单口季》第二季(下称《喜单2》)圆满收官,一众“小人物”也终于走出心底的浪浪山:翟佳宁一语点醒内耗人:唯心主义的最高境界是唯我独尊
2025-09-14 06:43:00
日前,山西转型综改示范区入区企业潞安化工机械(集团)有限公司成功通过国家市场监督管理总局的严格审核,获颁压力容器分析设计(SAD)许可资质
2025-09-14 07:28:00
机器隆隆,一排排制作好的夹芯板整齐排列,格外亮眼。连日来,山西钢构科工有限公司围护结构智能制造车间内机器轰鸣、智能设备有序运转
2025-09-14 07:28:00
百度发债,释放何种信号?
9月8日,百度宣布计划于美国境外以离岸交易方式,发行以人民币计值的优先无担保票据;票据发行所得款项净额将用作一般公司用途
2025-09-13 09:38:00
不挤牙膏、全面堆料,iPhone 17能赢回中国用户吗?
“透视图”是36氪新推出的轻量化数据图文栏目——以数据透视趋势,以图片呈现要点。"Talk is Cheap. Show me the data
2025-09-13 14:55:00
全网高呼“小米太子你糊涂啊”,他被辞退揭开大厂的头号隐患
数日前人们讨论得有多热闹,如今的沉默就多震耳欲聋。小米辞退被外界称为“雷军接班人”的王腾一事,似乎再无下文。就连王腾以前几乎天天发的微博
2025-09-13 23:24:00
鲁网9月12日讯近日,北京国际大数据交易所专家朱大培携蘑菇车联信息科技有限公司、北京优锘科技有限公司、泰安协同软件有限公司一行来高新区调研数据要素相关工作
2025-09-13 08:51:00
德百家电澳德乐店开业盛典暨卡萨帝美食争霸赛报名火热开启
鲁网9月12日讯(记者 逯广宇 实习记者 李安琦)当智能科技邂逅舌尖美味,一场兼具创意与惊喜的盛宴即将登场!9月10日
2025-09-13 09:26:00
江苏南京:机器人“交警” “上岗”倒计时
机器人“交警” “上岗”倒计时能指挥交通,会查酒驾和巡逻,正由宁企携手国内人形机器人“领头羊”联手开发众擎机器人未来将走上大街
2025-09-13 09:57:00
济南能投集团斩获CMMI5级国际认证,软件研发实力跻身国际领先水平!
近日,济南能投集团山东和同信息科技股份有限公司(以下简称“和同信息”)成功通过全球软件能力成熟度模型集成最高等级——CMMI5级认证
2025-09-13 12:04:00
济南能源投资控股集团2025年高校毕业生业务轮训圆满收官
9月12日,济南能源投资控股集团2025年高校毕业生业务轮训工作正式落下帷幕。本次轮训为期两周,聚焦新入职大学生成长需求与能投集团人才储备目标
2025-09-13 12:11:00
数智化会员经济峰会暨数韵商城产业集群品牌盛典圆满落幕!
数智化会员经济峰会暨数韵商城产业集群品牌盛典2025年9月9日,湖南长沙星光熠熠、热潮涌动!绿之韵·数韵国际重磅打造的数智化会员经济峰会暨数韵商城产业集群品牌盛典盛大启幕
2025-09-13 15:20:00
叫叫亮相2025年服贸会 儿童数字内容领域创新成果集中亮相
2025 年 9 月 10 日至 14 日,以 “数智领航,服贸焕新” 为年度主题的中国国际服务贸易交易会(简称 “服贸会”)在北京盛大举办
2025-09-13 15:20:00
贵州酒业封坛策划公司亿加管理助力酱酒产业峰会、封坛文化节落地
项目总策划总负责人:龙亿加(龙娟)项目总督导执行人:甘霖项目服务体系督导:甘霖项目营销体系建设:胡建强项目销讲营销成交:胡建强项目营销辅导:刘进路项目品牌视觉管理:张怀宇项目仪式指导司仪:一洋从 “基础筑基” 到 “细节落地”
2025-09-13 15:21:00
当前,人工智能以颠覆性力量重塑教育生态,为人们带来高效、个性化的学习体验。聚焦国内,教育数字化已成为我国开辟教育发展新赛道
2025-09-13 15:22:00