profiling-analysis-computing

Installation
SKILL.md

Profiling 计算瓶颈分析 Skill

功能概述

该Skill用于分析Ascend NPU系统中的计算瓶颈问题,当主分析Skill检测到计算耗时占比超过85%时自动触发。包含完整的分析流程:

核心分析步骤

  1. 高耗时算子筛选:从op_statistic_.csv、op_summary_.csv或kernel_details.csv文件中筛选Top-N高耗时算子
  2. 数据透视表分析:基于高耗时算子列表,生成性能数据透视表,分析各类型指令占比和瓶颈
  3. 算子形状解析:提取MatMul等常用算子的输入形状,提供更直观的性能分析视角

脚本组成

  • op_high_time_selector.py:高耗时算子筛选脚本
  • op_pivot_table_analyzer.py:数据透视表分析脚本
  • extract_op_shapes.py:算子形状解析脚本
  • op_perf_analysis_combine.py:整合脚本,自动执行完整分析流程(主技能调用时使用)

输入参数

Installs
8
GitHub Stars
93
First Seen
Apr 18, 2026
profiling-analysis-computing — ascend-ai-coding/awesome-ascend-skills