voice-clone-tts
SKILL.md
声纹克隆 & 语音合成
何时使用此 Skill
| 场景 | 是否需要此 Skill |
|---|---|
| 数字人平台支持声纹克隆(可灵/即梦/HeyGen) | 不需要,直接在 digital-avatar 里处理 |
| 数字人平台不支持声纹克隆 | 需要,生成音频后上传 |
| 纯音频输出(播客/有声书) | 需要 |
| 需要更精细的语音控制 | 可选,MiniMax/ElevenLabs 控制更细 |
推荐:优先用数字人平台自带的声纹克隆,保持后端一致性。
功能
- 声纹克隆:上传音频样本 → 生成声纹 ID
- 语音合成:文本 + 声纹 → 音频文件