消息称 DeepSeek V4 模型打破惯例:华为等国内厂商可早期访问,不让英伟达 AMD 先用

DeepSeek 在即将推出 V4 模型前,未按行业惯例向美国芯片制造商英伟达和 AMD 提供早期访问权限,而是优先向包括华为在内的国内厂商开放适配。该模型代号为“Sealion-lite”,支持100万 tokens的上下文窗口和多模态推理,且知识库已更新至2025年5月。

2 月 27 日消息,据路透社 2 月 26 日报道,两位了解情况的消息人士表示,DeepSeek 在即将进行重大模型更新之前,未向美国芯片制造商展示其即将推出的旗舰模型,这打破了行业标准做法。

相反,DeepSeek V4 向国内供应商 —— 包括华为技术有限公司 —— 提供了早期访问权限。

报道提到,AI 开发者通常会将主要模型的预发布版本分享给英伟达和 AMD 等芯片制造商,以确保其软件在广泛使用的硬件上高效运行。DeepSeek 之前曾与英伟达的技术人员密切合作。

对于其即将推出的模型,DeepSeek 没有向英伟达和 AMD 提供访问权限,而是给予包括华为在内的中国厂商几周的时间来适配其芯片

英伟达和 AMD 拒绝评论。DeepSeek 和华为没有回应评论请求。

消息源 @legit_api 于 2 月 26 日在 X 平台发布推文,报道称 DeepSeek 正在测试 V4 Lite 模型,代号为“Sealion-lite”,上下文窗口为 100 万 tokens,并是原生支持多模态推理。

IT之家注意到,本月早些时候,DeepSeek 更新之后开始灰度测试最高 1M(百万)Token 的上下文长度与此同时,最新 DeepSeek 的知识库已经更新到 2025 年 5 月,非联网状态下可准确输出 2025 年 4 月的新闻。

版权声明:本站文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明出处!

评论加载中...