profiling-analysis-computing
Installation
SKILL.md
Profiling 计算瓶颈分析 Skill
功能概述
该Skill用于分析Ascend NPU系统中的计算瓶颈问题,当主分析Skill检测到计算耗时占比超过85%时自动触发。包含完整的分析流程:
核心分析步骤
- 高耗时算子筛选:从op_statistic_.csv、op_summary_.csv或kernel_details.csv文件中筛选Top-N高耗时算子
- 数据透视表分析:基于高耗时算子列表,生成性能数据透视表,分析各类型指令占比和瓶颈
- 算子形状解析:提取MatMul等常用算子的输入形状,提供更直观的性能分析视角
脚本组成
- op_high_time_selector.py:高耗时算子筛选脚本
- op_pivot_table_analyzer.py:数据透视表分析脚本
- extract_op_shapes.py:算子形状解析脚本
- op_perf_analysis_combine.py:整合脚本,自动执行完整分析流程(主技能调用时使用)