登录
下载
Skill UI
浏览并发现
10388+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
FSDP2
,共找到
2
条记录
默认排序
最新上传
最多下载
TorchTitan 分布式预训练
distributed-llm-pretraining-torchtitan
Orchestra-Research/AI-Research-SKILLs
65
基于 PyTorch 的 TorchTitan 实现 4D 并行(FSDP2/TP/PP/CP),支持 8~512+ GPU、Float8、编译优化与分布式检查点,用于 Llama 3.1、DeepSeek V3 或自定义大模型的预训练。
查看详情
PyTorch FSDP2 训练流程
pytorch-fsdp2
Orchestra-Research/AI-Research-SKILLs
439
指导在训练脚本中正确引入 PyTorch FSDP2 fully_shard,使底层模块逐层分片、配置混合精度与 CPU 卸载、构建依赖 DTensor 的优化器,并依靠分布式检查点处理超过单卡显存或需要 DeviceMesh 分片的模型。
查看详情
1
语言
简体中文
English