torch-npu-comm-test
Installation
SKILL.md
Torch Communication Operator Test
通过 PyTorch torch.distributed 接口,使用 HCCL 后端在昇腾 NPU 上测试通信算子的功能与性能。
Overview
何时使用本 Skill(vs hccl-test)
| 场景 | 推荐工具 |
|---|---|
| 验证 HCCL 库基础连通性和带宽 | hccl-test(mpirun) |
| 测试特定 tensor shape 下的通信性能 | torch-npu-comm-test |
| 复现训练中某一层梯度的通信耗时 | torch-npu-comm-test |
| 测试 bf16 / fp16 等训练常用 dtype | torch-npu-comm-test |
| 测试进程子组(subgroup)通信 | torch-npu-comm-test |
| 新集群交付验收、大规模打流 | hccl-test(mpirun) |