torch-npu-comm-test

Installation
SKILL.md

Torch Communication Operator Test

通过 PyTorch torch.distributed 接口,使用 HCCL 后端在昇腾 NPU 上测试通信算子的功能与性能。

Overview

何时使用本 Skill(vs hccl-test)

场景 推荐工具
验证 HCCL 库基础连通性和带宽 hccl-test(mpirun)
测试特定 tensor shape 下的通信性能 torch-npu-comm-test
复现训练中某一层梯度的通信耗时 torch-npu-comm-test
测试 bf16 / fp16 等训练常用 dtype torch-npu-comm-test
测试进程子组(subgroup)通信 torch-npu-comm-test
新集群交付验收、大规模打流 hccl-test(mpirun)

核心优势

Installs
13
GitHub Stars
93
First Seen
Mar 27, 2026
torch-npu-comm-test — ascend-ai-coding/awesome-ascend-skills