profiling-analysis-profiling-computing
Installation
SKILL.md
Profiling 计算瓶颈分析 Skill
功能概述
该Skill用于分析Ascend NPU系统中的计算瓶颈问题,当主分析Skill检测到计算耗时占比超过85%时自动触发。包含两个独立的脚本:
- op_high_time_selector.py:从op_statistic_.csv、op_summary_.csv或kernel_details.csv文件中筛选高耗时算子
- op_pivot_table_analyzer.py:基于高耗时算子列表,生成数据透视表
同时提供整合版本op_perf_pivot_table.py,用于保持向后兼容性,自动调用上述两个脚本。
- extract_op_shapes.py:从op_analysis_details.csv文件中提取算子形状信息