6月15日,月之暗面 Kimi 推出 Kimi K2.7 Code 模型高速版,已对 Kimi Code Beta 计划成员、Kimi API 开发者和 Kimi Business 用户开放。高速版为相同模型但推理速度提升约5–6倍:常规编程场景约180 Tokens/s,短上下文场景可达260 Tokens/s。定价为标准 K2.7 Code 的两倍:1M tokens 的标准输入和输出分别为13元和54元,命中缓存的输入为2.6元。文章同时提及 K2.7 Code 于6月12日发布,相较于 K2.6 在长上下文编程场景中提升指令遵循能力与长程任务表现,减少过度思考并平均节省约30% token 消耗。
6 月 15 日消息,月之暗面 Kimi 今日宣布,Kimi K2.7 Code 模型高速版上线,现已向 Kimi Code Beta 计划成员、Kimi API 开发者、Kimi Business 用户开放。
据介绍,高速版与 Kimi K2.7 Code 是相同模型,输出速度约为普通版的 5-6 倍,常规编程场景下(取输入长度中位数)输出速度约 180 Tokens/s,短上下文场景可达 260 Tokens/s。

Kimi K2.7 Code 高速版价格为 Kimi K2.7 Code 的两倍:1M tokens 的标准输入和输出价格分别为 13 元和 54 元;命中缓存的输入价格为 2.6 元。

据IT之家此前报道,Kimi K2.7 Code 编程模型发布于 6 月 12 日。内外部基准评估显示,Kimi K2.7 Code 相比 K2.6 模型显著提升了长上下文编程场景的指令遵循能力、长程编程任务的性能表现,并且大幅改善了在长程任务中的过度思考倾向,平均 token 消耗减少 30%。
