minimax-image-understanding
SKILL.md
图片理解
调用多模态大模型理解图片,生成精准的业务描述。
支持的模型
| 模型 | 环境变量 | 说明 |
|---|---|---|
| MiniMax VLM | MINIMAX_API_KEY, MINIMAX_API_HOST |
默认,推荐用于中文理解 |
| OpenAI | OPENAI_API_KEY |
GPT-4V |
| Anthropic | ANTHROPIC_API_KEY |
Claude Vision |
使用方法
前提条件
设置对应模型的环境变量(至少一个):
调用多模态大模型理解图片,生成精准的业务描述。
| 模型 | 环境变量 | 说明 |
|---|---|---|
| MiniMax VLM | MINIMAX_API_KEY, MINIMAX_API_HOST |
默认,推荐用于中文理解 |
| OpenAI | OPENAI_API_KEY |
GPT-4V |
| Anthropic | ANTHROPIC_API_KEY |
Claude Vision |
设置对应模型的环境变量(至少一个):