triton-operator-code-gen

Installation
SKILL.md

Triton 算子代码生成

核心原则

计算逻辑 → Tiling 策略 → 代码实现。顺序不可颠倒。

Triton API 路径优先级

  1. tl.tanh / tl.erf / tl.sqrt — 推荐,性能最优
  2. tl.math.tanh / tl.math.erf — 备选
  3. triton.language.extra.ascend.libdevice / triton.language.extra.libdevice — 以上找不到时

自由度:中高(计算逻辑不可错,实现方式灵活)

参考资源加载

阶段 必须加载 不要加载
设计 Tiling hardware-architecture.md templates.md
Related skills

More from ascend/agent-skills

Installs
57
GitHub Stars
14
First Seen
Apr 3, 2026