登录
下载
Skill UI
浏览并发现
9185+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
DeepSpeed
,共找到
4
条记录
默认排序
最新上传
最多下载
DeepSpeed 分布式训练指南
deepspeed
Orchestra-Research/AI-Research-SKILLs
56
指导工程师掌握 DeepSpeed 分布式训练与 DeepNVMe I/O 优化,涵盖 ZeRO、流水线并行、混合精度以及同步/异步写入句柄的使用场景。
查看详情
简化的分布式训练
huggingface-accelerate
Orchestra-Research/AI-Research-SKILLs
216
HuggingFace Accelerate 通过四行代码将各种 PyTorch 脚本升级为支持 DDP、DeepSpeed、FSDP 与 Megatron 的分布式训练,自动处理设备调度、混合精度与配置交互,便于快速实验与跨硬件部署。
查看详情
MoE模型训练与优化
moe-training
Orchestra-Research/AI-Research-SKILLs
497
本技能详细介绍了专家混合模型(MoE)的训练方法,涵盖Mixtral、DeepSeek-V3等前沿模型架构。它指导用户如何在计算资源有限的情况下,实现大规模模型能力的扩展和高效训练。核心内容包括Top-k路由机制、负载均衡、专家并行以及使用DeepSpeed和HuggingFace等框架进行优化,显著降低训练成本。
查看详情
PyTorch Lightning 训练框架
pytorch-lightning
Orchestra-Research/AI-Research-SKILLs
235
PyTorch Lightning 提供高层训练框架,内置分布式训练(DDP/FSDP/DeepSpeed)、回调、检查点、日志与设备管理,帮助你从笔记本到多节点集群轻松运行高质量模型训练。
查看详情
1
语言
简体中文
English