media-transcriber
media-transcriber — 音视频逐字稿转录
作者:43 COLLEGE 凯寓 (KAIYU) 出品 版本:v1.0
使用 OpenAI Whisper 将视频/音频文件转为带时间戳的逐字稿。支持说话人识别和 Claude 标点恢复。
第一次运行时会自动创建虚拟环境、安装依赖并下载 Whisper 模型(turbo 约 1.5GB),全程自动,无需手动配置。
重要:首次转录前必须提前告知用户——模型下载 + 依赖安装可能需要 5-15 分钟(取决于网速),期间终端可能长时间没有新输出,这不是卡死。务必在执行转录命令前向用户说明这一点,避免用户中途强制中断导致环境损坏。
如果运行报错缺少 ffmpeg 或需要配置说话人识别,读 SETUP.md 完成首次配置。
跨平台兼容
| 项目 | macOS / Linux | Windows |
|---|---|---|
| Python | python3 |
python |
| 路径分隔符 | / |
\ |
More from 43college/43-agent-skills
email-invoice-processor
邮箱发票处理器。按日期范围从邮箱中筛选发票邮件,下载PDF/图片附件(含链接下载),提取发票字段,按购买方分sheet生成Excel汇总。当用户需要处理发票、整理发票、从邮箱提取发票时使用此技能。
18follow-builders
AI 构建者日报 — 追踪 X 和 YouTube 播客上的顶尖 AI 构建者,将内容混编为易读摘要。当用户想了解 AI 行业动态、构建者近况或调用 /ai 时使用。无需 API 密钥或依赖 — 所有内容从中央 feed 获取。
15find-skills
帮助用户发现和安装 Claude Code 技能。当用户问"怎么做 X"、"找一个能做 X 的技能"、"有没有技能可以……"或想扩展 AI 能力时使用此技能。通过 skills.sh 生态搜索、验证质量、协助安装。
13chat-archiver
对话入库器。当用户说"入库"、"归档对话"、"把这次对话存下来"或"/chat-archiver"时触发。回顾当前对话,提取有价值的内容,分类后存入用户的知识库。支持 config 映射和自动发现两种模式。
13feishu-assistant
飞书助手:消息、文档、知识库、通讯录、日历、群聊、任务、多维表格(Base)、邮箱。当用户提到飞书相关操作(发消息、写文档、查知识库、看群聊、管理任务、操作多维表格、查邮件、发邮件、收件箱)时使用此技能。
11web-browser
浏览器联网工具。当需要真实浏览器环境时使用此 skill,包括:需要登录态的操作、反爬严格的平台(小红书、微信公众号等)、页面交互操作、动态渲染内容抓取等。简单搜索和公开页面抓取可直接使用内置的 WebSearch/WebFetch,无需加载此 skill。
11