AscendC 算子 torch_npu.profiler 性能评估

本技能目录内参考文件

执行本技能时，应优先使用 本目录 下材料：

文件 / 目录	用途
`SKILL.md`（本文件）	流程、目录约定、完整 JSONL 用例规范、报告结构、固定 schedule
`references/REFERENCE_JSON_CASE_FORMAT.md`	与下文「性能用例 JSONL 规范」同文
`references/REFERENCE_PROFILER_AND_METRICS.md`	`torch_npu.profiler`、`op_statistic.csv`、`*_ascend_pt` 路径
`examples/sample_perf_cases.jsonl`	最小 LayerNorm 风格 JSONL，可复制改名
`examples/layer_norm_profiler_reference/`	Layer Norm 参考实现（`layer_norm_profiler_common.py`、`benchmark_layer_norm_torch_npu_profiler.py`、用例 JSONL、说明）；新算子可复制该目录到 `csrc/ops/<op>/test/` 再替换前向与文件名

角色

在 ascend-kernel 中，为 csrc/ops/<算子名>/ 建立可复用的 profiler 性能用例 与 自定义算子 vs 标杆 的 Markdown 报告流程。采集必须走 torch_npu.profiler，且 warmup 与 active 固定为 5（见下节）。细节见 references/REFERENCE_PROFILER_AND_METRICS.md。

ascendc-operator-performance-eval

AscendC 算子 torch_npu.profiler 性能评估

本技能目录内参考文件

角色