DeepSeek V4、姚顺雨新混元模型被曝下月发布，两大国产 AI 巨头同台竞技

2026年03月14日 11:46 ItHome 0 阅读 0 评论

文章介绍了多条关于国产大模型新品的爆料与线索：据称DeepSeek V4与姚顺雨领衔的腾讯混元新模型均计划于2026年4月发布。OpenRouter上线的Healer Alpha与Hunter Alpha被认为与新一代多模态模型相关，Healer Alpha被标注具备视觉、听觉、推理与行动能力并需遵守中国法规。DeepSeek V4据称侧重长期记忆、视觉处理与AI搜索（并深度适配国产芯片），其团队近期发表了与条件记忆和架构优化相关的论文；姚顺雨的新混元模型规模约30B，研究重心在上下文学习与Agent可用性（CL-bench）。文章认为此次更新超越参数竞赛，双方均在为更好进入生产环境做技术路线布局。

据《白鲸实验室》独家爆料，DeepSeek V4 和姚顺雨领衔操刀的混元新模型，均预计将于下个月（2026 年 4 月）发布。

3 月 11 日，OpenRouter 新上线了两个神秘模型 ——Healer Alpha 与 Hunter Alpha。

OpenRouter 页面显示，Healer Alpha 被描述为具备视觉、听觉、推理与行动能力的前沿全模态模型；

社区因此迅速将其与尚未发布的新一代国产模型联系起来，据称捕捉到了「系统提示词中要求严格遵守中国法律法规」。

https://x.com/chetaslua/status/2031983459057672455

而就在 3 月 12 日，据《白鲸实验室》独家爆料（独家｜梁文锋将携 DeepSeek V4 撞上姚顺雨）：

DeepSeek V4 将于 4 月正式上线。

作为梁文锋打磨已久的多模态大模型，DeepSeek V4 除了代码能力跃升，还会在长期记忆上取得突破。

这一方向与 DeepSeek 团队近几个月的公开研究脉络基本一致。

2026 年 1 月，梁文锋署名论文《Conditional Memory via Scalable Lookup》提出「条件记忆」机制；2025 年 12 月的《mHC：Manifold-Constrained Hyper-Connections》则继续指向底层架构优化。

两篇论文都在尝试处理 Transformer 在记忆、训练稳定性和长上下文上的瓶颈。

据《白鲸实验室》独家爆料（独家｜梁文锋将携 DeepSeek V4 撞上姚顺雨）：

梁文锋过去半年的主要工作，是补齐 DeepSeek 在视觉内容处理和 AI 搜索上的短板。

为强化 AI 搜索能力，DeepSeek 早在去年就已与百度展开合作。

梁文锋这次为 DeepSeek V4 设定的关键迭代方向，正是长期记忆能力。

DeepSeek V4 还将深度适配国产芯片，并有望成为首个完全跑在国产算力生态上的大模型。

另一个已被公开验证的现实是，DeepSeek 的产品声量已经抬高了市场预期。

DeepSeek App 上线至 2025 年 2 月 9 日，累计下载量已超过 1.1 亿次，周活跃用户规模最高接近 9700 万。

姚顺雨的全新混元模型也计划于 4 月发布

DeepSeek 之外，腾讯也在为 4 月准备新动作。

姚顺雨已于 2025 年 12 月出任腾讯总办首席 AI 科学家，同时兼任 AI Infra 部和大语言模型部负责人。

2026 年 2 月，署名包含姚顺雨的论文 CL-bench 发布，提出一套面向「上下文学习」的新评测基准，继续把腾讯混元的研究焦点推向长上下文与 Agent 可用性。

https://arxiv.org/abs/2602.03587

据《白鲸实验室》独家爆料（独家｜梁文锋将携 DeepSeek V4 撞上姚顺雨）：

姚顺雨也将在 4 月发布新的混元模型，规模约为 30B 参数。

早在 2025 年初，姚顺雨就已接受邀请回国；实际上，姚顺雨对新模型的准备早已开始，而不是只有官宣后的不到半年时间。

**今年 1 月末，《晚点 LatePost》也已爆料（字节、阿里、腾讯 AI 大战全记录：一场影响命运的战争）：**在腾讯内部，姚顺雨要求团队不要以打榜为导向。

从公开轨迹看，4 月这一轮更新不会只是一次参数竞赛。

DeepSeek 的已知研究正向长期记忆、多模态和底层架构延伸，腾讯混元则在上下文学习和真实任务评测上加快补课。

两条路线很不一样，但都在试图回答同一个问题：下一个阶段的大模型，究竟该怎样真正走进生产环境。

参考资料：

评论加载中...