登录
下载
Skill UI
浏览并发现
9916+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
混合精度
,共找到
3
条记录
默认排序
最新上传
最多下载
DeepSpeed 分布式训练指南
deepspeed
Orchestra-Research/AI-Research-SKILLs
424
指导工程师掌握 DeepSpeed 分布式训练与 DeepNVMe I/O 优化,涵盖 ZeRO、流水线并行、混合精度以及同步/异步写入句柄的使用场景。
查看详情
简化的分布式训练
huggingface-accelerate
Orchestra-Research/AI-Research-SKILLs
490
HuggingFace Accelerate 通过四行代码将各种 PyTorch 脚本升级为支持 DDP、DeepSpeed、FSDP 与 Megatron 的分布式训练,自动处理设备调度、混合精度与配置交互,便于快速实验与跨硬件部署。
查看详情
PyTorch FSDP2 训练流程
pytorch-fsdp2
Orchestra-Research/AI-Research-SKILLs
439
指导在训练脚本中正确引入 PyTorch FSDP2 fully_shard,使底层模块逐层分片、配置混合精度与 CPU 卸载、构建依赖 DTensor 的优化器,并依靠分布式检查点处理超过单卡显存或需要 DeviceMesh 分片的模型。
查看详情
1
语言
简体中文
English