ascendc-operator-performance-eval

Installation
SKILL.md

AscendC 算子 torch_npu.profiler 性能评估

本技能目录内参考文件

执行本技能时,应优先使用 本目录 下材料:

文件 / 目录 用途
SKILL.md(本文件) 流程、目录约定、完整 JSONL 用例规范、报告结构、固定 schedule
references/REFERENCE_JSON_CASE_FORMAT.md 与下文「性能用例 JSONL 规范」同文
references/REFERENCE_PROFILER_AND_METRICS.md torch_npu.profilerop_statistic.csv*_ascend_pt 路径
examples/sample_perf_cases.jsonl 最小 LayerNorm 风格 JSONL,可复制改名
examples/layer_norm_profiler_reference/ Layer Norm 参考实现layer_norm_profiler_common.pybenchmark_layer_norm_torch_npu_profiler.py、用例 JSONL、说明);新算子可复制该目录到 csrc/ops/<op>/test/ 再替换前向与文件名

角色

ascend-kernel 中,为 csrc/ops/<算子名>/ 建立可复用的 profiler 性能用例自定义算子 vs 标杆 的 Markdown 报告流程。采集必须走 torch_npu.profiler,且 warmupactive 固定为 5(见下节)。细节见 references/REFERENCE_PROFILER_AND_METRICS.md

Related skills

More from ascend/agent-skills

Installs
54
GitHub Stars
14
First Seen
Apr 3, 2026