ai-for-science-ankh
Installation
SKILL.md
Ankh 昇腾 NPU 迁移 Skill
本 Skill 用于处理 Ankh、Ankh base/large、Ankh3 large/XL 以及同类基于
HuggingFace Transformers 与 PyTorch 的蛋白质语言模型仓库,把默认的
CUDA/GPU 运行方式迁移为可在华为 Ascend NPU 上运行、验证、做最小训练闭环的实现。
适用于“标准 Transformers 模型主体 + 设备层仍写死 CUDA”的迁移场景,重点覆盖 环境检查、统一设备层、本地权重目录加载、验证脚本补齐和 README 文档沉淀。
本 Skill 的重点不是重写模型结构,而是:
- 统一设备层,去掉写死的
torch.cuda、.cuda()、cuda:0 - 适配本地 HuggingFace 权重目录加载
- 补齐 Ascend 环境说明、验证脚本、训练 smoke test
- 明确哪些内容已完成,哪些仍需用户补环境或硬件权限
详细示例与扩展说明见: