Video Producer

Installation
SKILL.md

Skill: Video Producer (工业级短视频自动化工作流)

Prerequisites

  • ffmpeg (处理视频比例、运镜、拼接、混音)
  • edge-tts (生成带有情绪的连续主音轨)
  • 内置工具 generate_video (仅用于生成无文字、非实操的情感类/人物类空镜)

Workflow (工作流步骤)

当用户要求生成短视频时,请严格按以下步骤执行,并必须在关键节点等待用户确认

Step 0: 素材盘点与确认 (Asset Check)

  • 当用户仅提供文案时,**首先【强制停顿】**询问用户:“是否有参考素材(图片、录屏、官方视频或网页 URL 等)需要穿插在视频中?”
  • 如果用户回答“没有”,则规划为100% 纯 AI 生成画面的分镜脚本。
  • 如果用户回答“有”或已经上传了素材,则先分析这些原始素材的内容。针对用户上传的视频素材,必须主动使用 ffprobe 提取准确的物理时长(精确到秒)。如果提供的是网页 URL,Agent 需准备调用浏览器自动化工具进行截屏或录制。

Step 1: 提炼分镜与脚本确认 (Human-in-the-loop 强制等待)

  • 根据 Step 0 的资产盘点,将文案拆分为具体的分镜脚本(Blocks)。
  • 【基于时长的字数约束】:规划旁白时,必须严格参考原视频素材的物理时长匹配对白字数。按照中文 TTS 正常语速(约 4.5字/秒)计算。例如:一段 10 秒的录屏切片,分配的对白必须控制在 40-45 字之间,防止音画严重脱节。
  • 【快节奏与静态画面限时】:为了保持短视频的快节奏,静态截图或图片的展示时间必须严格限制在 3 秒以内。如果该段旁白配音超过 3 秒,必须拆分分镜:前 3 秒展示截图,剩余时间使用相关的 AI 生成动态画面(B-roll)来无缝填充,绝不能删减原旁白文字或让单张图片定格过久。
Related skills
Installs
First Seen