华为昇腾384超节点训练效率突破!XTuner V1开源助力大模型训练性能跃升
2025-09-08

华
华为昇腾
强中性
查看报告
上海人工智能实验室开源新一代超大模型训练引擎XTuner V1,该引擎基于PyTorch FSDP开发,通过显存、通信、负载等多维度优化,支持1T参数量级MoE模型训练,在200B以上量级混合专家模型训练吞吐上超越传统3D并行方案。同时,实验室与昇腾团队在昇腾384超节点(Atlas 900 A3 SuperPoD)上联合优化,利用其硬件特性(如高速互联、计算通信解耦)实现训练吞吐较业界产品提升5%以上,MFU提升20%以上,相关AIOps工具DeepTrace与ClusterX同步开源。


本页面内容由AI提炼生成,无法确保完全真实准确,不代表希财网官方立场,不构成投资建议。如需阅读详细说明,请点击此处
