byted-voice-to-text

Installation
SKILL.md

Voice to Text Skill

基于火山引擎 BigModel ASR 将语音转为文字。准确率和多语言能力远优于本地 whisper,且速度更快。

核心执行流

  1. 收到飞书语音消息(message_type: audio),需要自动识别语音内容
  2. 用户给音频要转文字
    • 先跑 inspect_audio.py
    • 再按时长、大小、URL/本地路径选择 asr_flash.py(极速版)或 asr_standard.py(标准版)
  3. 缺 ffmpeg / ffprobe:先执行 ensure_ffmpeg.py --execute
  4. 用户问安装、开通、手工配置:按文末 reference map 读取对应文档

强制规则(最高优先级)

Related skills

More from volcengine/agentkit-samples

Installs
6
GitHub Stars
310
First Seen
Mar 27, 2026