下载

Skill UI

浏览并发现 9688+ 精选技能

全部编程开发人工智能设计创意产品商业数据科学市场营销职场通用效率工具硬件工程语言学习

搜索训练框架，共找到 20 条记录

默认排序最新上传最多下载

BLIP-2 视觉语言框架

blip-2-vision-language

Orchestra-Research/AI-Research-SKILLs

该框架将冻结的图像编码器与大语言模型连接，适用于图像描述、视觉问答、检索与多模态对话，在无需微调的条件下实现零样本推理，并仅训练轻量 Q-Former。

LLM 评估框架

evaluating-llms-harness

Orchestra-Research/AI-Research-SKILLs

提供涵盖 MMLU、HumanEval、GSM8K、TruthfulQA、HellaSwag 等 60+ 学术基准测试的标准化评估流程，可用来对 HuggingFace、vLLM 或 API 模型打分、比对性能、跟踪训练进度。

梯度裁剪助手

gradient-clipping-helper

jeremylongshore/claude-code-plugins-plus-skills

梯度裁剪助手针对机器学习训练流程提供自动化支持，指导梯度裁剪模式、生成可部署代码与配置，并校验 PyTorch、TensorFlow 等框架下的结果。

MoE模型训练与优化

Orchestra-Research/AI-Research-SKILLs

本技能详细介绍了专家混合模型（MoE）的训练方法，涵盖Mixtral、DeepSeek-V3等前沿模型架构。它指导用户如何在计算资源有限的情况下，实现大规模模型能力的扩展和高效训练。核心内容包括Top-k路由机制、负载均衡、专家并行以及使用DeepSpeed和HuggingFace等框架进行优化，显著降低训练成本。

极简GPT模型训练与学习系统

Orchestra-Research/AI-Research-SKILLs

nanoGPT是一个极简主义的GPT模型实现，专为教育和学习设计。它以简洁、可修改的代码复刻了GPT-2的核心架构，使用户能够从零开始理解整个Transformer流程。该框架支持完整的工作流，包括数据准备、模型训练和文本生成，非常适合学习NLP和深度学习原理的学生和研究人员。

OpenRLHF训练套件

openrlhf-training

Orchestra-Research/AI-Research-SKILLs

一个基于Ray和vLLM的高性能RLHF训练框架，兼容PPO、GRPO、RLOO、DPO，借助ZeRO-3与分布式架构在多GPU集群上加速7B-70B+大模型的策略与奖励优化流程。

PyTorch Lightning 训练框架

pytorch-lightning

Orchestra-Research/AI-Research-SKILLs

PyTorch Lightning 提供高层训练框架，内置分布式训练（DDP/FSDP/DeepSpeed）、回调、检查点、日志与设备管理，帮助你从笔记本到多节点集群轻松运行高质量模型训练。

PyTorch模型因果干预

pyvene-interventions

Orchestra-Research/AI-Research-SKILLs

pyvene是一个用于在PyTorch模型上执行因果干预的声明式框架。它支持激活打补丁、因果追踪（ROME风格）和交替干预训练等高级实验。适用于需要测试模型因果假设、深入理解模型组件工作机制或确保可复现性的AI研究场景。

句向量嵌入框架

sentence-transformers

Orchestra-Research/AI-Research-SKILLs

Sentence Transformers 提供 5000+ 预训练模型，可生成句、文本与图像嵌入，支持 RAG、语义搜索、聚类、多语言与多模态，适合本地生产环境使用。

SLIME 强化训练框架

slime-rl-training

Orchestra-Research/AI-Research-SKILLs

为 GLM 系列大模型提供基于 Megatron-LM 与 SGLang 的后训练强化学习指导，包含 GRPO rollout、灵活数据缓冲与异步/多轮训练流程，适用于研究及产研部署。

稀疏自编码器：模型可解释性分析

sparse-autoencoder-training

Orchestra-Research/AI-Research-SKILLs

本工具提供稀疏自编码器（SAE）的训练和分析框架。SAEs能够将大型语言模型内部密集的、多义的激活信号分解为稀疏、单义的特征。适用于需要发现模型学到的离散可解释概念、研究特征叠加性，或分析模型内部特定安全相关行为（如偏见或欺骗）的场景。

PyTorch原生智能体RL训练框架

torchforge-rl-training

Orchestra-Research/AI-Research-SKILLs

torchforge是Meta推出的用于智能体强化学习（RL）的PyTorch原生框架。它将核心的RL算法与复杂的分布式基础设施进行了彻底分离。用户可以专注于算法的快速实验和开发，无需担心底层分布式训练、权重同步等复杂问题，支持从单卡到大规模集群的扩展训练。

语言