Improvement Learner

Real Karpathy self-improvement loop: evaluate → modify → re-evaluate → keep/revert → repeat.

When to Use

查看一个 skill 在 9 个维度上的质量评分（accuracy/coverage/reliability/efficiency/security/trigger_quality/leakage/knowledge_density + 综合分）
运行自动改进循环（Pareto front 保护，不允许任何维度回退）
追踪 skill 评估分数的历史变化
诊断某个 skill 扣分原因（哪些 checklist item 未通过）
对比纯文本 skill 和带脚本 skill 的评分差异
为 autoloop-controller 提供收敛判断的分数数据
验证改进后分数是否真正提升（改前/改后对比）
使用 --mock 模式快速调试评分逻辑而不消耗 LLM tokens