登录
下载
Skill UI
浏览并发现
9699+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
分布式
,共找到
8
条记录
默认排序
最新上传
最多下载
AI高级语义上下文恢复
code-refactoring-context-restore
sickn33/antigravity-awesome-skills
134
这是一个用于恢复和重建复杂项目上下文的高级系统。它适用于分布式、多智能体AI工作流,通过语义向量搜索和精确的知识筛选,确保长周期AI项目知识的高保真度和连续性,实现无缝的上下文管理和状态恢复。
查看详情
AI工作流上下文恢复
context-management-context-restore
sickn33/antigravity-awesome-skills
352
这是一个复杂的内存管理系统,用于在复杂的、分布式的多智能体AI工作流中,恢复、重构和维护项目上下文。它专注于高级语义记忆重构,利用语义向量搜索、相关性排序和冲突解决机制,确保知识的连续性与历史信息的保真度。
查看详情
TorchTitan 分布式预训练
distributed-llm-pretraining-torchtitan
Orchestra-Research/AI-Research-SKILLs
65
基于 PyTorch 的 TorchTitan 实现 4D 并行(FSDP2/TP/PP/CP),支持 8~512+ GPU、Float8、编译优化与分布式检查点,用于 Llama 3.1、DeepSeek V3 或自定义大模型的预训练。
查看详情
分布式训练配置
distributed-training-setup
jeremylongshore/claude-code-plugins-plus-skills
496
提供分布式训练配置的自动化指导,涵盖逐步流程、生产级配置和输出校验,助力机器学习训练任务的规范实施。
查看详情
OpenRLHF训练套件
openrlhf-training
Orchestra-Research/AI-Research-SKILLs
474
一个基于Ray和vLLM的高性能RLHF训练框架,兼容PPO、GRPO、RLOO、DPO,借助ZeRO-3与分布式架构在多GPU集群上加速7B-70B+大模型的策略与奖励优化流程。
查看详情
PyTorch原生智能体RL训练框架
torchforge-rl-training
Orchestra-Research/AI-Research-SKILLs
135
torchforge是Meta推出的用于智能体强化学习(RL)的PyTorch原生框架。它将核心的RL算法与复杂的分布式基础设施进行了彻底分离。用户可以专注于算法的快速实验和开发,无需担心底层分布式训练、权重同步等复杂问题,支持从单卡到大规模集群的扩展训练。
查看详情
火山引擎LLM强化训练
verl-rl-training
Orchestra-Research/AI-Research-SKILLs
398
使用火山引擎 verl 训练 LLM 的强化学习指南,涵盖 GRPO、PPO、价值网络、分布式 rollout、数据配置与生产部署等流程。
查看详情
AI智能体工作流编排
dmux-workflows
affaan-m/everything-claude-code
242
用于管理和协调涉及多个AI智能体和任务的复杂工作流。它支持将任务分配给多个工作节点,处理运行时错误,并将分散的结果进行智能合并,适用于大规模、分布式的人工智能计算流程。
查看详情
1
语言
简体中文
English