下载

Skill UI

浏览并发现 9699+ 精选技能

全部编程开发人工智能设计创意产品商业数据科学市场营销职场通用效率工具硬件工程语言学习

搜索分布式，共找到 8 条记录

默认排序最新上传最多下载

AI高级语义上下文恢复

code-refactoring-context-restore

sickn33/antigravity-awesome-skills

这是一个用于恢复和重建复杂项目上下文的高级系统。它适用于分布式、多智能体AI工作流，通过语义向量搜索和精确的知识筛选，确保长周期AI项目知识的高保真度和连续性，实现无缝的上下文管理和状态恢复。

AI工作流上下文恢复

context-management-context-restore

sickn33/antigravity-awesome-skills

这是一个复杂的内存管理系统，用于在复杂的、分布式的多智能体AI工作流中，恢复、重构和维护项目上下文。它专注于高级语义记忆重构，利用语义向量搜索、相关性排序和冲突解决机制，确保知识的连续性与历史信息的保真度。

TorchTitan 分布式预训练

distributed-llm-pretraining-torchtitan

Orchestra-Research/AI-Research-SKILLs

基于 PyTorch 的 TorchTitan 实现 4D 并行（FSDP2/TP/PP/CP），支持 8~512+ GPU、Float8、编译优化与分布式检查点，用于 Llama 3.1、DeepSeek V3 或自定义大模型的预训练。

分布式训练配置

distributed-training-setup

jeremylongshore/claude-code-plugins-plus-skills

提供分布式训练配置的自动化指导，涵盖逐步流程、生产级配置和输出校验，助力机器学习训练任务的规范实施。

OpenRLHF训练套件

openrlhf-training

Orchestra-Research/AI-Research-SKILLs

一个基于Ray和vLLM的高性能RLHF训练框架，兼容PPO、GRPO、RLOO、DPO，借助ZeRO-3与分布式架构在多GPU集群上加速7B-70B+大模型的策略与奖励优化流程。

PyTorch原生智能体RL训练框架

torchforge-rl-training

Orchestra-Research/AI-Research-SKILLs

torchforge是Meta推出的用于智能体强化学习（RL）的PyTorch原生框架。它将核心的RL算法与复杂的分布式基础设施进行了彻底分离。用户可以专注于算法的快速实验和开发，无需担心底层分布式训练、权重同步等复杂问题，支持从单卡到大规模集群的扩展训练。

火山引擎LLM强化训练

verl-rl-training

Orchestra-Research/AI-Research-SKILLs

使用火山引擎 verl 训练 LLM 的强化学习指南，涵盖 GRPO、PPO、价值网络、分布式 rollout、数据配置与生产部署等流程。

AI智能体工作流编排

affaan-m/everything-claude-code

用于管理和协调涉及多个AI智能体和任务的复杂工作流。它支持将任务分配给多个工作节点，处理运行时错误，并将分散的结果进行智能合并，适用于大规模、分布式的人工智能计算流程。

1

语言