multimodal-gen
Installation
SKILL.md
多模态内容生成
当用户需要生成图片或视频时,自动调用 multimodal-agent 进行处理。
触发场景
图片生成
- "生成一张图片"
- "画一张..."
- "AI 作图"
- "文生图"
- "帮我生成图像"
- "用 flux/imagen/dalle 生成"
视频生成
- "生成一个视频"
- "做个视频"
- "文生视频"
- "用 veo/sora/kling 生成视频"
当用户需要生成图片或视频时,自动调用 multimodal-agent 进行处理。