external-gitcode-ascend-triton-operator-dev
Installation
SKILL.md
Triton 算子全流程开发
工作流概览
构建 Triton 算子分 7 个阶段(含 1 个条件阶段):
| # | 阶段 | 产出 | Skill | 是否可跳过 |
|---|---|---|---|---|
| 1 | 环境配置 | 环境验证报告 | triton-operator-env-config |
是:torch/torch_npu/triton 已可用 |
| 2 | 需求设计 | 设计文档 | triton-operator-design |
是:用户已提供完整设计文档 |
| 3 | 代码生成 | kernel + smoke test | triton-operator-code-gen |
否 |
| 4 | 静态检视 | 检视报告 | triton-operator-code-review |
否 |
| 5 | 精度验证 | 精度报告 | triton-operator-precision-eval |
否 |
| 6 | 性能评估 | 性能报告 + ratio | triton-operator-performance-eval |
否 |
| 7 | 性能优化 | 优化后代码 | triton-operator-performance-optim |
条件:ratio ≥ 目标则跳过 |