swe-bench
Installation
SKILL.md
SWE-BenchStandard Solving Workflow
本技能指导你按照 SWE-Bench 的严苛标准解决 GitHub Issue。不仅是修复代码,更是要证明修复的正确性和无副作用。
🏆 核心原则 (Core Principles)
- Reproduction First: 修改代码前,必须先编写复现脚本,证明 Bug 存在。
- Test Driven: 只有当复现脚本从 Fail 变为 Pass,且不破坏原有测试时,任务才算完成。
- Minimal Changes: 只修改必要的文件,避免重构无关代码。
🚀 标准工作流 (Standard Workflow)
请严格按照以下 5 个阶段执行:
Phase 1: Issue Analysis (审题)
- 阅读 Issue: 理解用户报告的 Bug 现象、环境和复现步骤。
- 调用工具: 使用
code_search初步探索 Issue 提到的报错信息或关键词。 - 输出: 明确 "Bug 预期行为" vs "实际行为"。