verl-quickstart
Installation
SKILL.md
VERL RL Quickstart
最小可跑的 VERL 强化学习流程(Ascend/NPU 友好)。
强约束
- 镜像版本
IMAGE_TAG:- 用户/运维已指定:必须使用其值
- 未指定默认:
- 910B:
verl-8.5.0-910b-ubuntu22.04-py3.11-v0.7.1 - A3:
verl-8.5.0-a3-ubuntu22.04-py3.11-v0.7.1
- 910B:
- 也可在 Quay tags 自选:
https://quay.io/repository/ascend/verl?tab=tags&tag=latest
- 修改或新建
examples/**/run_*.sh后,除非用户明确说“只写不跑”,必须执行一次冒烟(至少trainer.total_epochs=1 trainer.test_freq=1),并返回日志绝对路径与tail -f命令。 - 使用 Megatron 训练后端时,
use_flash_attn=True作为默认参数必须开启(至少 actor 侧开启;若 ref 侧未继承则显式补齐)。