video-subtitle-skill
SKILL.md
视频字幕生成器 (Video Subtitle Generator)
基于 SenseAudio ASR API,为视频或音频文件自动生成字幕。
核心功能
- 语音识别 — 自动识别视频/音频中的语音内容,生成带时间戳的字幕
- 多语言支持 — 支持中文、英文、日文、韩文等 20+ 种语言
- 字幕翻译 — 识别后可自动翻译成目标语言
- 说话人分离 — 多人对话场景自动区分不同说话人
- 字幕烧入 — 将生成的字幕直接烧入视频输出新文件
- 多格式输出 — 支持 SRT / VTT / TXT / JSON 格式
使用方式
用户说出类似以下请求时触发此 Skill:
- "帮我给这个视频加字幕"
- "识别这个音频的内容并生成字幕"
- "把这个英文视频翻译成中文字幕"