media-transcriber

Installation
SKILL.md

media-transcriber — 音视频逐字稿转录

作者:43 COLLEGE 凯寓 (KAIYU) 出品 版本:v1.0

使用 OpenAI Whisper 将视频/音频文件转为带时间戳的逐字稿。支持说话人识别和 Claude 标点恢复。

第一次运行时会自动创建虚拟环境、安装依赖并下载 Whisper 模型(turbo 约 1.5GB),全程自动,无需手动配置。

重要:首次转录前必须提前告知用户——模型下载 + 依赖安装可能需要 5-15 分钟(取决于网速),期间终端可能长时间没有新输出,这不是卡死。务必在执行转录命令前向用户说明这一点,避免用户中途强制中断导致环境损坏。

如果运行报错缺少 ffmpeg 或需要配置说话人识别,读 SETUP.md 完成首次配置。

跨平台兼容

项目 macOS / Linux Windows
Python python3 python
路径分隔符 / \
Related skills

More from 43college/43-agent-skills

Installs
11
GitHub Stars
8
First Seen
Apr 12, 2026