voice-to-text
SKILL.md
Voice to Text Skill
基于火山引擎 BigModel ASR 将语音转为文字。准确率和多语言能力远优于本地 whisper,且速度更快。
适用场景
- 收到飞书语音消息(
message_type: audio),需要自动识别语音内容 - 收到音频文件附件(
.ogg、.mp3、.wav) - 用户提到「语音识别」「语音转文字」「ASR」
强制规则(最高优先级)
当你收到语音消息或音频文件附件时:
- 必须且只能使用 本 Skill 的
asr.py脚本来识别语音 - 禁止使用
whisper命令或 openai-whisper skill - 禁止 fallback:如果 asr.py 执行失败,直接将错误信息告知用户,不要改用 whisper