金融时报报道称深度求索(DeepSeek)将于下周发布全新多模态大语言模型 V4,支持图片、视频与文本生成功能,并计划同步公开技术说明。该模型已联合华为和寒武纪优化硬件适配,有望提振本土半导体需求。
2 月 28 日消息,金融时报(FT)今天(2 月 28 日)发布博文,报道称深度求索(DeepSeek)将于下周发布全新多模态大语言模型 V4,原生支持图片、视频与文本生成功能。
这是 DeepSeek 自 2025 年 1 月推出 R1 推理模型以来的首个重大版本更新,有望进一步填补国内低成本、开源模型的市场需求。
IT之家援引博文介绍,在下周发布 V4 时,DeepSeek 计划同步公开一份简短的技术说明,并于约一个月后发布详尽的工程报告。
在硬件适配方面,消息称 DeepSeek 为国产算力提供深度支持,已联合华为和寒武纪优化 V4 模型的硬件适配,预估大幅提振本土半导体需求,并加速 AI 模型“推理”环节靠拢本土芯片。
相关阅读:
- 《DeepSeek 新论文剧透 V4 新框架:用闲置网卡加速智能体推理性能,打破 PD 分离瓶颈》
- 《消息称 DeepSeek V4 模型打破惯例:华为等国内厂商可早期访问,不让英伟达 AMD 先用》
- 《OpenRouter:中国 AI 模型 2 月全球 token 用量首超美国,MiniMax 等四款大模型霸榜前五》
- 《DeepSeek V4 Lite 原生多模态 AI 曝光:百万 tokens 上下文,非思考生图秒杀前代》