external-gitcode-ascend-triton-operator-precision-eval
Installation
SKILL.md
Triton 算子精度评估
核心原则
精度是算子正确性的底线。验证通过前不做性能优化。
工作流
- 编写 Torch 参考实现(标杆)
- 编写测试用例(覆盖多种 shape × dtype × 边界情况)
- 在 NPU 上执行 Triton 算子和 Torch 参考实现
- 用
test_common.validate_cmp()比对,生成精度报告
MANDATORY - READ ENTIRE FILE:编写测试前,完整阅读 scripts/test_common.py。
误差阈值
判定条件:MERE < 阈值 且 MARE < 10 × 阈值