DeepSeek 更新官网 API 文档并宣布旗下旗舰模型 DeepSeek-V4-Pro 开启限时 2.5 折优惠(活动至北京时间 2026-05-05 23:59)。调价后计费为:输入(缓存命中)0.25 元/百万 tokens、输入(缓存未命中)3 元/百万、输出 6 元/百万。该模型基于混合专家(MoE)架构,总参数量约 1.6 万亿,单次激活约 490 亿,支持百万级超长上下文。DeepSeek 表示受限于高端算力,Pro 版本当前吞吐有限,预计昇腾 950 超节点批量上市后价格将进一步下调;文中并提及多家硬件/云厂商已适配 DeepSeek-V4 系列。
4 月 25 日消息,DeepSeek 官网刚刚更新了 API 文档。页面宣布旗下新发布的旗舰级大模型 DeepSeek-V4-Pro 开启限时 2.5 折优惠活动。
此次调价后,DeepSeek-V4-Pro 的输入价格(缓存命中)低至 0.25 元(每百万 tokens),输入价格(缓存未命中)为 3 元,输出价格为 6 元。此次优惠活动将持续至北京时间 2026 年 5 月 5 日 23:59。

DeepSeek-V4-Pro 模型采用了业界领先的混合专家(MoE)架构,其总参数量达到 1.6 万亿,单次激活参数约为 490 亿。除了海量的参数,该模型还全面支持百万级别的超长上下文窗口。
DeepSeek 方面已经确认,受限于高端算力,目前 Pro 版本的服务吞吐较为有限,预计下半年昇腾 950 超节点批量上市后,Pro 的价格还将大幅下调。IT之家此前报道,昇腾超节点全系列产品也已全面支持 DeepSeek-V4 系列模型。
相关阅读:
- 《迈入百万上下文普惠时代:DeepSeek-V4 模型预览版正式上线并同步开源》
- 《寒武纪 Day 0 适配 DeepSeek-V4,发布当日即稳定运行》
- 《华为云首发适配 DeepSeek-V4,提供免部署、一键调用 API 的 Tokens 服务》
- 《摩尔线程携手智源 FlagOS,为 MTT S5000 GPU 完成 DeepSeek-V4 模型 Day-0 适配》
- 《英伟达已适配 DeepSeek-V4 AI 模型,GB200 NVL72 开箱性能超 150 tokens / sec / user》