MiniMax 为 OpenClaw“小龙虾”推出新技能,实现定制音色、创作完整歌曲

文章介绍了 MiniMax 将其 MiniMax Speech(语音)和 Music(音乐)模型通过深度封装作为 Skill 上架到 OpenClaw 生态,使得 OpenClaw 中的“小龙虾”可以在飞书、企业微信、钉钉等 IM 平台实现定制音色的文字转语音与语音回复,并能创作完整歌曲、纯音乐或人声哼唱的 demo。文中说明了 Voice Maker 包含 40+ 语言和近百种预置音色、支持脚本自动切分与自然语言驱动的音色设计;Music Maker 可生成最长约 5 分钟的流行音乐或纯音乐,并配合 Music Expert 自动添加结构化标签与分段方案。还列出通过 Clawhub/MaxClaw 上传 Skill、验证 MiniMax API Key 并在 IM 中以音频消息形式使用的基本使用流程。

3 月 9 日消息,今日,MiniMax 宣布将 MiniMax Speech 语音模型和 Music 音乐模型的开放平台接口进行了深度封装,并正式上架到了 OpenClaw 生态中。

IT之家从官方介绍获悉,通过在 Clawhub 中学习新 Skill,你的小龙虾不仅可以在飞书、企业微信、钉钉等 IM 中拥有定制音色、语音回复消息,还能够创作完整歌曲、不同风格的纯音乐、以及人声哼唱的 demo,变成一个既会说话又会唱歌的全能 AI 搭子。

MiniMax 将文字转语音、音色设计等强大功能集合在了 Voice Maker 技能中。小龙虾通过学习并成功验证 MiniMax API Key 后,即可解锁“语言大师”身份。

它不仅内置了 40+ 种语言和近百种预置音色,还支持自动切分脚本,轻松搞定多重语音、多情感的段落配音。与此同时,团队将音色设计(Voice Design)功能也集成到了 Skill 中。用户可以直接用自然语言描述心中想要的音色,实现对音色多维度的精准创造。

此外,在学习了 Music Maker 技能并验证 API Key 后,小龙虾就拥有了音乐创作能力。无论是一首长达 5 分钟的完整流行音乐、一段用来放松的纯音乐,还是随口的一段哼唱旋律,它都能轻松拿捏。

如果用户对歌曲有分段落、更加精细化的创作需求,该团队另在 Clawhub 也上传 「Music Expert」Skill ,可以对结构化标签进行自动添加,并自动给出不同乐曲段落的方案。

除了在 OpenClaw 让你的小龙虾学习这两个 Skill 外,也可以在 MaxClaw 中直接体验,或者在已配对的 IM 软件(飞书、企业微信、钉钉等)中发送 Skill 和指令。

初次使用,下载对应 Skill 的 zip 文件,在 MaxClaw 对话框中上传,通过自然语言沟通,提供 API Key 即可在 MaxClaw 中加载对应能力。通过指令技巧和参数配置,你的小龙虾也可以绕过传统的文件形式,直接在飞书中以音频消息的形式向你发送内容。

版权声明:本站文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明出处!

评论加载中...