omnihuman-video
Installation
SKILL.md
OmniHuman v1.5 音频驱动视频
字节跳动 OmniHuman v1.5 是一款音频驱动的视频生成模型。输入一张人物图片和一段音频,即可生成口型同步、表情生动的高质量视频。角色的情感和动作与音频高度关联。
可用模型
| 模型 ID | 功能 | 说明 |
|---|---|---|
fal-ai/bytedance/omnihuman/v1.5 |
图片+音频→视频 | 口型同步、表情驱动,$0.16/秒 |
工作流
1. 调用 submit_task
使用 MCP 工具 submit_task 提交任务: