下载

Skill UI

浏览并发现 10029+ 精选技能

全部编程开发人工智能设计创意产品商业数据科学市场营销职场通用效率工具硬件工程语言学习

搜索训练，共找到 160 条记录

默认排序最新上传最多下载

LLM模型剪枝实用指南

Orchestra-Research/AI-Research-SKILLs

通过 Wanda、SparseGPT 与 N:M 结构化剪枝，快速压缩大语言模型，提升稀疏度与推理速度，无需再训练即可部署在移动或边缘硬件。

MoE模型训练与优化

Orchestra-Research/AI-Research-SKILLs

本技能详细介绍了专家混合模型（MoE）的训练方法，涵盖Mixtral、DeepSeek-V3等前沿模型架构。它指导用户如何在计算资源有限的情况下，实现大规模模型能力的扩展和高效训练。核心内容包括Top-k路由机制、负载均衡、专家并行以及使用DeepSpeed和HuggingFace等框架进行优化，显著降低训练成本。

极简GPT模型训练与学习系统

Orchestra-Research/AI-Research-SKILLs

nanoGPT是一个极简主义的GPT模型实现，专为教育和学习设计。它以简洁、可修改的代码复刻了GPT-2的核心架构，使用户能够从零开始理解整个Transformer流程。该框架支持完整的工作流，包括数据准备、模型训练和文本生成，非常适合学习NLP和深度学习原理的学生和研究人员。

GPU驱动数据策划

Orchestra-Research/AI-Research-SKILLs

NeMo Curator 依托 GPU 与 RAPIDS，为文本/图像/视频/音频等多模态提供质量筛选、模糊与语义去重、PII/NSFW 处理等步骤，快速清洗大规模训练数据。

OpenRLHF训练套件

openrlhf-training

Orchestra-Research/AI-Research-SKILLs

一个基于Ray和vLLM的高性能RLHF训练框架，兼容PPO、GRPO、RLOO、DPO，借助ZeRO-3与分布式架构在多GPU集群上加速7B-70B+大模型的策略与奖励优化流程。

闪电注意力优化器

optimizing-attention-flash

Orchestra-Research/AI-Research-SKILLs

Flash Attention 优化器在训练或运行长序列 Transformer 时提供 2-4 倍加速和 10-20 倍内存削减，适用于缓解注意力显存瓶颈与推理延迟，支持 PyTorch 原生 SDPA、flash-attn 库、H100 FP8 及滑动窗口注意力等场景。

深度学习模型优化

optimizing-deep-learning-models

jeremylongshore/claude-code-plugins-plus-skills

通过分析模型结构、数据与指标，自动选择优化器、调度学习率和正则化方法，生成优化后的代码并评估准确率、训练时间与资源消耗，适合需要提升性能与效率的深度学习模型。

Optuna 训练试验助手

optuna-study-creator

jeremylongshore/claude-code-plugins-plus-skills

自动触发的 ML 训练技能，识别“optuna study creator”相关请求后，即提供数据准备、模型训练、超参数调优与实验追踪等全流程指导，并给出生产级代码与校验。

PEFT 高效微调指南

peft-fine-tuning

Orchestra-Research/AI-Research-SKILLs

介绍 HuggingFace PEFT 中 LoRA/QLoRA 微调流程，帮助在有限 GPU 上只训练小于 1% 参数并高效管理多适配器部署。

Pubsub 主题配置指南

pubsub-topic-setup

jeremylongshore/claude-code-plugins-plus-skills

自动化指导 Google Cloud Pubsub 主题配置，提供最佳实践、生成可投产的配置与校验，服务于 GCP 技能训练与实践场景。

PyTorch FSDP2 训练流程

Orchestra-Research/AI-Research-SKILLs

指导在训练脚本中正确引入 PyTorch FSDP2 fully_shard，使底层模块逐层分片、配置混合精度与 CPU 卸载、构建依赖 DTensor 的优化器，并依靠分布式检查点处理超过单卡显存或需要 DeviceMesh 分片的模型。

PyTorch Lightning 训练框架

pytorch-lightning

Orchestra-Research/AI-Research-SKILLs

PyTorch Lightning 提供高层训练框架，内置分布式训练（DDP/FSDP/DeepSpeed）、回调、检查点、日志与设备管理，帮助你从笔记本到多节点集群轻松运行高质量模型训练。

上一页 1 2 3 456 7 8...12 13 14 下一页

语言