登录
下载
Skill UI
浏览并发现
5146+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
模型训练
,共找到
4
条记录
默认排序
最新上传
最多下载
DeepSpeed 分布式训练助手
deepspeed
Orchestra-Research/AI-Research-SKILLs
227
提供 DeepSpeed 分布式训练指导,包括 ZeRO、流水线并行、混合精度、DeepNVMe I/O 等实战细节,适合实现、调试和部署大模型时查阅。
查看详情
TorchTitan 分布式大模型预训练
distributed-llm-pretraining-torchtitan
Orchestra-Research/AI-Research-SKILLs
228
TorchTitan 提供 PyTorch 原生的 4D 并行分布式大语言模型预训练能力,涵盖 FSDP2/TP/PP/CP、Float8、torch.compile 与分布式检查点,可在 8 到 512+ GPUs 上训练 Llama 3.1、DeepSeek V3 等模型。
查看详情
PyTorch Lightning 训练框架
pytorch-lightning
Orchestra-Research/AI-Research-SKILLs
235
PyTorch Lightning 提供高层训练框架,内置分布式训练(DDP/FSDP/DeepSpeed)、回调、检查点、日志与设备管理,帮助你从笔记本到多节点集群轻松运行高质量模型训练。
查看详情
Pyvene 因果干预框架
pyvene-interventions
Orchestra-Research/AI-Research-SKILLs
109
面向 PyTorch 模型的声明式因果干预工具,包含激活修补、因果追踪与互换干预训练,便于研究者验证模型组件的因果作用并共享实验。
查看详情
1
语言
简体中文
English