training-llms-megatron

Installation

SKILL.md

Megatron-Core - Large-Scale LLM Training

Megatron-Core trains LLMs from 2B to 462B parameters with up to 47% Model FLOP Utilization on H100 GPUs through advanced parallelism strategies.

Installation:

# Docker (recommended)
docker run --gpus all -it --rm nvcr.io/nvidia/pytorch:25.04-py3

# Or pip
pip install megatron-core

Simple distributed training:

# Train with 2 GPUs using data parallelism
torchrun --nproc_per_node=2 examples/run_simple_mcore_train_loop.py

Installs

Repository

First Seen

Apr 21, 2026

Security Audits

training-llms-megatron — kiterlin/intelligent-detection-system