Claude Code 推出“快速模式”预览版，大幅提升 Opus 4.6 响应速度

Claude Code 推出快速模式（Fast mode）研究预览版，通过优化 Opus 4.6 的 API 配置，在保持模型质量不变的前提下显著降低响应延迟。该模式适用于 Pro、Team 等订阅用户及 Console 用户，需通过“额外用量”计费，目前定价为每百万 Token 输入 30 美元、输出 150 美元，并提供限时折扣。

2 月 8 日消息，Claude Code 推出快速模式（Fast mode）研究预览版。该模式通过优化 Opus 4.6 的 API 配置，在保持模型质量不变的前提下显著降低响应延迟。

官方称，快速模式并非独立模型，其仍使用相同的 Opus 4.6 模型，仅采用不同的 API 配置，优先保障速度而非成本效益。响应质量与功能完全一致，仅响应速度更快。

Fast mode 适用于 Pro、Team 等订阅用户及 Console 用户，需通过“额外用量”计费。第三方提供商 Amazon Bedrock、Google Vertex AI 和 Microsoft Azure Foundry 均不支持快速模式。

目前该模式定价为每百万 Token 输入 30 美元、输出 150 美元。太平洋时间 2 月 16 日晚上 11:59 前，所有方案均可享受 50% 的限时折扣。

IT之家此前报道，2 月 6 日 Anthropic 发布了新一代 Claude Opus 4.6 模型，支持 200K 上下文窗口（测试版提供 100 万 token），最大输出 token 数提升至 128K，较前代 64K 限制翻倍。该模型引入自适应思考模式，可根据问题复杂度动态调整思考深度，并新增最高级别的 max effort 参数。新版本还推出上下文压缩功能，当对话接近窗口限制时自动总结早期内容，实现近乎无限长度的对话。