登录
下载
Skill UI
浏览并发现
10271+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
DDP
,共找到
4
条记录
默认排序
最新上传
最多下载
简化的分布式训练
huggingface-accelerate
Orchestra-Research/AI-Research-SKILLs
490
HuggingFace Accelerate 通过四行代码将各种 PyTorch 脚本升级为支持 DDP、DeepSpeed、FSDP 与 Megatron 的分布式训练,自动处理设备调度、混合精度与配置交互,便于快速实验与跨硬件部署。
查看详情
PyTorch Lightning 训练框架
pytorch-lightning
Orchestra-Research/AI-Research-SKILLs
235
PyTorch Lightning 提供高层训练框架,内置分布式训练(DDP/FSDP/DeepSpeed)、回调、检查点、日志与设备管理,帮助你从笔记本到多节点集群轻松运行高质量模型训练。
查看详情
PyTorch Lightning深度学习框架
pytorch-lightning
K-Dense-AI/scientific-agent-skills
449
PyTorch Lightning是一个全面的深度学习框架,用于组织和自动化PyTorch模型的训练流程。它通过将模型组织为LightningModules,简化了繁琐的编写代码,并在Trainer中自动化训练循环。该框架支持多GPU/TPU分布式训练(DDP, FSDP),并集成了数据加载、回调函数和实验跟踪(W&B, MLflow),适用于构建专业、可扩展的深度学习项目。
查看详情
CoreWeave分布式GPU训练工作流
coreweave-core-workflow-b
jeremylongshore/claude-code-plugins-plus-skills
142
本指南详细介绍了如何在CoreWeave平台上运行大规模的分布式GPU训练任务。它涵盖了单节点多GPU配置和多节点训练,支持PyTorch DDP,是进行大型语言模型(LLM)微调或需要高性能计算集群的深度学习模型训练的推荐工作流。
查看详情
1
语言
简体中文
English