$ npx skills add https://www.modelscope.cn/skills/@aaaaqwq/multimodal-gen
当用户需要生成图片或视频时,自动调用 multimodal-agent 进行处理。
multimodal-agent