Claude Code 推出“快速模式”预览版,大幅提升 Opus 4.6 响应速度

Claude Code 推出快速模式(Fast mode)研究预览版,通过优化 Opus 4.6 的 API 配置,在保持模型质量不变的前提下显著降低响应延迟。该模式适用于 Pro、Team 等订阅用户及 Console 用户,需通过“额外用量”计费,目前定价为每百万 Token 输入 30 美元、输出 150 美元,并提供限时折扣。

2 月 8 日消息,Claude Code 推出快速模式(Fast mode)研究预览版。该模式通过优化 Opus 4.6 的 API 配置,在保持模型质量不变的前提下显著降低响应延迟。

官方称,快速模式并非独立模型,其仍使用相同的 Opus 4.6 模型,仅采用不同的 API 配置,优先保障速度而非成本效益。响应质量与功能完全一致,仅响应速度更快。

Fast mode 适用于 Pro、Team 等订阅用户及 Console 用户,需通过“额外用量”计费。第三方提供商 Amazon Bedrock、Google Vertex AI 和 Microsoft Azure Foundry 均不支持快速模式。

目前该模式定价为每百万 Token 输入 30 美元、输出 150 美元。太平洋时间 2 月 16 日晚上 11:59 前,所有方案均可享受 50% 的限时折扣。

IT之家此前报道,2 月 6 日 Anthropic 发布了新一代 Claude Opus 4.6 模型,支持 200K 上下文窗口(测试版提供 100 万 token),最大输出 token 数提升至 128K,较前代 64K 限制翻倍。该模型引入自适应思考模式,可根据问题复杂度动态调整思考深度,并新增最高级别的 max effort 参数。新版本还推出上下文压缩功能,当对话接近窗口限制时自动总结早期内容,实现近乎无限长度的对话。

版权声明:本站文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明出处!

评论加载中...