omnihuman-video

Installation
SKILL.md

OmniHuman v1.5 音频驱动视频

字节跳动 OmniHuman v1.5 是一款音频驱动的视频生成模型。输入一张人物图片和一段音频,即可生成口型同步、表情生动的高质量视频。角色的情感和动作与音频高度关联。

可用模型

模型 ID 功能 说明
fal-ai/bytedance/omnihuman/v1.5 图片+音频→视频 口型同步、表情驱动,$0.16/秒

工作流

1. 调用 submit_task

使用 MCP 工具 submit_task 提交任务:

Installs
2
Repository
openclaw/skills
GitHub Stars
4.5K
First Seen
Feb 16, 2026
omnihuman-video — openclaw/skills