external-gitcode-ascend-ascendc-operator-dev
Installation
SKILL.md
AscendC 算子端到端开发编排
Skill类型:流程导向型(七阶段工作流,子技能串行编排)
本 skill 编排七个子 skill,驱动 ascend-kernel 算子从零到生产可用。
核心原则
- 七阶段串行:工程初始化 → 设计文档 → 用例生成 → 代码生成&测试 → 接口文档 → 精度评估 → 性能评测,严格顺序执行
- 子技能执行:每个阶段 MUST 调用对应子 skill,不得自行实现
- 阶段门控:前一阶段检查点全部通过后才进入下一阶段
- 设计驱动编码:代码生成依赖设计文档中的 Tiling 策略和 UB 分配表
- 自动化设计:无需用户预先提供设计文档,设计阶段自动生成
- 用例统一生成:设计完成后立即生成测试用例文档,供后续精度评估和性能评测复用
- 文档闭环:编译测试通过后 MUST 生成 PyTorch 风格的中文接口文档,并在聊天界面展示
- 精度闭环:算子必须通过 ≥30 例全面精度评估才算完成
- 性能闭环:算子必须通过 msprof 性能对比评测,输出性能报告
- 结果可视化:Phase 4/5/6/7 的结果 MUST 以 Markdown 形式直接展示在聊天界面中,不要仅输出路径