wxa-skills-eval

Installation
SKILL.md

wxa-skills-eval

一句话定位:基于开发者声明的 Skill,自动构造真实用户任务,模拟用户与小程序 Agent 多轮对话完成任务,并对全过程进行评测与缺陷归因,输出 HTML 报告 + 可机读 JSON。

何时加载

满足任一条件即应加载:

  • 需要评测、调试、定位 wxapp 中 AI Skill(app.json::agent.skills)的端到端质量
  • 希望以"模拟真实用户"的方式回归 Skill 行为,提前发现意图理解、参数抽取、调用链路或最终回复中的缺陷

运行环境

  • 已支持 macOSWindows 两个平台(自动按平台适配 DevTools CLI 路径与命令行调用)
  • 新版开发者工具(macOS .pkg / Windows 安装包)安装后自动注册 wechatidecli 环境变量,评测工具会优先探测使用,无需手动配置路径
  • 旧版开发者工具需通过 DEVTOOLS_ENV_APP_PATH 环境变量或 --devtools-app-path 参数配置安装路径;详见 references/configuration.md

核心能力

Installs
4
GitHub Stars
19
First Seen
1 day ago
wxa-skills-eval — wechat-miniprogram/ai-mode-skills