Kimi首发“上下文缓存”技术，助推长文本大模型降本90%

近日，月之暗面宣布 Kimi 开放平台正式公测新技术——上下文缓存（Context Caching），该技术在 API 价格不变的前提下，可为开发者降低最高90% 的长文本大模型使用成本，并且显著提升模型的响应速度。据了解，月之暗面是国内首家面向开发者推出上下文缓存（Context Caching）技

......

本文由站长之家用户投稿发布于站长之家平台，本平台仅提供信息索引服务。为了保证文章信息的及时性，内容观点的准确性，平台将不提供完全的内容展现，本页面内容仅为平台搜索索引使用。需阅读完整内容的用户，请查看原文，获取内容详情。

即将跳转到外部网站

安全性未知，是否继续

继续前往

全球参数最大开源模型马斯克也点赞！月之暗面Kimi K3开源 2.8万亿参数

2026-07-282.3万阅读

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

Kimi首发“上下文缓存”技术，助推长文本大模型降本90%

推荐关键词

24小时热搜

大家正在看

当企业遇到突发法律纠纷，什么样的响应速度才算“及时”？

月之暗面最强模型！Kimi K3发布：全球首个开源3万亿级别模型

全球参数最大开源模型马斯克也点赞！月之暗面Kimi K3开源 2.8万亿参数

Kimi K3爆火算力紧缺！月之暗面宣布暂停C端新用户订阅

全球最大2.8万亿参数大模型 Kimi K3今晚正式开源：性能坐稳前三

国产大模型之光Kimi K3火速上线白B.AI 一站式体验全球顶尖AI产品

超越Opus 4.7美国顶级大模型 Kimi K3即将发布：2.5万亿怪兽级AI

苹果iOS 27公测版已上线：老款iPhone升级后响应速度更快

AI日报：Kimi K3登顶全球最大开源模型；小度AI手表Fit开售；我国启动大模型 IPv6 专项行动

Kimi K3上线“大爆”：“掉队者”如何重新上桌？

国产模型Kimi K3实测表现亮眼：审美优于ChatGPT 5.6 Sol 定价还更低

Kimi回应马斯克隔空宣战：欢迎加入2万亿+俱乐部

AI日报：开源模型Kimi K3登场；Google Vids引入Gemini Omni模型；智谱AI冲击10亿美元ARR

豆包图像创作模型Seedream 5.0 Pro API上线：像素级编辑、专业级可控

AI日报：MiniMax Code 2.0桌面端发布；Kimi K3模型预热视频流出；通义千问正式接入苹果生态

2.8万亿、全球最大、马斯克第二次点赞：Kimi K3凭什么刷屏海内外

GPUStack Day 0 支持 Kimi-K3：8×B300 上 vLLM 与 SGLang 推理实测

AI日报：谷歌发布 Gemini 3.6 Flash；小红书大模型IMO满分夺金；腾讯Miora AI创意平台全量上线

AI日报：Claude Code更新v2.1.202版本；支付宝AI开放平台开启邀测；xAI全面升级Grok Voice

当大模型公司开始造手机

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

Kimi首发“上下文缓存”技术，助推长文本大模型降本90%

推荐关键词

24小时热搜

大家正在看

当企业遇到突发法律纠纷，什么样的响应速度才算“及时”？

月之暗面最强模型！Kimi K3发布：全球首个开源3万亿级别模型

全球参数最大开源模型 马斯克也点赞！月之暗面Kimi K3开源 2.8万亿参数

Kimi K3爆火算力紧缺！月之暗面宣布暂停C端新用户订阅

全球最大2.8万亿参数大模型 Kimi K3今晚正式开源：性能坐稳前三

国产大模型之光Kimi K3火速上线白B.AI 一站式体验全球顶尖AI产品

超越Opus 4.7美国顶级大模型 Kimi K3即将发布：2.5万亿怪兽级AI

苹果iOS 27公测版已上线：老款iPhone升级后响应速度更快

AI日报：Kimi K3登顶全球最大开源模型；小度AI手表Fit开售；我国启动大模型 IPv6 专项行动

Kimi K3上线“大爆”：“掉队者”如何重新上桌？

国产模型Kimi K3实测表现亮眼：审美优于ChatGPT 5.6 Sol 定价还更低

Kimi回应马斯克隔空宣战：欢迎加入2万亿+俱乐部

AI日报：开源模型Kimi K3登场；Google Vids引入Gemini Omni模型；智谱AI冲击10亿美元ARR

豆包图像创作模型Seedream 5.0 Pro API上线：像素级编辑、专业级可控

AI日报：MiniMax Code 2.0桌面端发布；Kimi K3模型预热视频流出；通义千问正式接入苹果生态

2.8万亿、全球最大、马斯克第二次点赞：Kimi K3凭什么刷屏海内外

GPUStack Day 0 支持 Kimi-K3：8×B300 上 vLLM 与 SGLang 推理实测

AI日报：谷歌发布 Gemini 3.6 Flash；小红书大模型IMO满分夺金；腾讯Miora AI创意平台全量上线

AI日报：Claude Code更新v2.1.202版本；支付宝AI开放平台开启邀测；xAI全面升级Grok Voice

当大模型公司开始造手机

全球参数最大开源模型马斯克也点赞！月之暗面Kimi K3开源 2.8万亿参数