triton-operator-precision-eval

Installation
SKILL.md

Triton 算子精度评估

核心原则

精度是算子正确性的底线。验证通过前不做性能优化。

工作流

  1. 编写 Torch 参考实现(标杆)
  2. 编写测试用例(覆盖多种 shape × dtype × 边界情况)
  3. 在 NPU 上执行 Triton 算子和 Torch 参考实现
  4. test_common.validate_cmp() 比对,生成精度报告

MANDATORY - READ ENTIRE FILE:编写测试前,完整阅读 scripts/test_common.py

误差阈值

判定条件:MERE < 阈值 且 MARE < 10 × 阈值

Related skills

More from ascend/agent-skills

Installs
51
GitHub Stars
14
First Seen
Apr 3, 2026