6月10日,摩尔线程发布并开源面向GPU底层算子生成的代码大模型MusaCoder,提供9B和27B两种参数规模。官方称这是业内首个在国产GPU(基于MTT S5000的夸娥智算集群)上完成全链路训练与验证的开源代码大模型,能够将PyTorch标准算子自动生成高性能CUDA/MUSA原生Kernel代码,旨在降低开发者手写底层GPU算子的门槛并提升代码生成、验证与优化效率。在KernelBench评测中,MusaCoder-27B-RL以Overall Pass@8 93.2%、Avg.@8 88.60%的成绩超越多款主流模型,达到行业领先水平。文章并附带模型和论文链接。
6 月 10 日消息,摩尔线程发布并开源面向 GPU 底层算子生成的专用代码大模型 MusaCoder,包含 9B 和 27B 两个参数规模。
据悉,这是业内首个基于国产 GPU 算力底座完成全链路训练与验证的开源代码大模型,其完整后训练流程均在基于 MTT S5000 构建的夸娥智算集群上完成。
IT之家获悉,该模型重点支持从 PyTorch 标准算子自动生成高性能 CUDA / MUSA 原生 Kernel 代码,旨在降低开发者手写底层 GPU 算子的门槛,提升 GPU 高性能计算场景下的代码生成、验证和优化效率。
官方表示,在 KernelBench 评测中,MusaCoder-27B-RL 以 Overall Pass@8 93.2%、Avg.@8 88.60% 的成绩,超越 Claude Opus 4.7、DeepSeek-V4 Pro、GLM-5.1、Kimi K2.6 等主流 SOTA 代码模型,性能达到当前行业领先水平。

IT之家附相关链接如下:
- **MusaCoder 模型:**https://huggingface.co/MooreThreads/MusaCoder-27B
- **MusaCoder 论文:**http://arxiv.org/abs/2606.04847