ga_vision
SKILL.md
ga_vision Skill
视觉理解 Skill,支持文字识别和图片理解,自动按优先级调度后端。
前置依赖
| 依赖 | 说明 | 安装方式 |
|---|---|---|
| rapidocr_onnxruntime | 必须,纯文字识别 | pip install rapidocr_onnxruntime |
| mmx CLI | 推荐,需 Token Plan 订阅 | npm install -g mmx-cli |
| vision_api | 备用,需魔搭 API Key | 见下方配置说明 |
魔搭(ModelScope) API Key 配置
获取地址:https://modelscope.cn → 右上角头像 → API-KEY
# 方式1: 环境变量
export MODELSCOPE_API_KEY="your_token_here"