英伟达发布 5500 亿参数 Nemotron 3 Ultra 开源模型,较同级别前沿模型推理速度最高提升 5 倍

英伟达发布了5500亿参数的混合专家模型 Nemotron 3 Ultra,面向全天候运行的长效智能体,官方称相较同级开源模型推理速度最高提升5倍、使用成本最高降低30%。该系列还新增安全防护与语音识别模型,已适配多种智能体平台(如 Hermes Agent、LangChain Deep Agents 等),并被 CrowdStrike、Palantir 等企业用于网络安全和前线部署场景;Nemotron 3 Ultra 预计于6月4日通过 Hugging Face、ModelScope、OpenRouter 及 NVIDIA 渠道以 NIM 微服务形式推出。

6 月 1 日消息,为加强自主智能体的智能能力,英伟达今日发布了面向全天候运行智能体的全新开源模型与数据集,相关成果由英伟达 Nemotron 联盟联合打造。

据官方介绍,英伟达 Nemotron 3 Ultra 是一款拥有 5500 亿参数的混合专家模型,可为代码开发、科研及企业业务流程中的长效智能体提供顶尖智能能力。相较于同级别主流开源前沿模型,该模型推理速度最高提升 5 倍,使用成本最高降低 30%,助力智能体更高效、低成本地完成各项任务。

Nemotron 3 Ultra 已完成适配主流智能体平台与调度框架的后置训练,企业可借助这类框架部署、统筹管理智能体,涵盖 Hermes Agent、LangChain Deep Agents、OpenClaw、OpenHands 以及 OpenCode。

此外,全新推出的安全防护与语音识别类 Nemotron 模型,进一步丰富了该模型系列的能力,可用于打造高效、专业化的企业级智能体。

目前,英伟达 Nemotron 模型已助力新一代长效人工智能智能体落地于多家企业平台,其中包括 CrowdStrike、Palantir。这类智能体能够协助团队分析复杂数据、统筹工作任务,并优化网络安全及企业整体运营流程。

CrowdStrike 将 Nemotron 模型应用于旗下专用智能体,可不间断排查漏洞、划分风险等级并修复配置错误,既能更快抵御网络攻击,也减轻了安全团队的运维压力。

Palantir 则把 Nemotron 模型接入其前线部署工程师(AI FDE)人工智能平台,实现复杂任务自主执行;同时依托智能体的交互数据持续迭代优化,搭建出适配特定业务领域、物理隔离的企业系统。

据IT之家了解,Nemotron 3 Ultra 预计将于 6 月 4 日通过 Hugging Face、ModelScope、OpenRouter 以及 build.nvidia.com 以 NVIDIA NIM™ 微服务的形式推出,同时也将通过广泛的 NVIDIA 云合作伙伴生态系统、推理平台和云服务提供商提供。

版权声明:本站文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明出处!

评论加载中...