登录
下载
Skill UI
浏览并发现
10029+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
训练
,共找到
160
条记录
默认排序
最新上传
最多下载
LLM模型剪枝实用指南
model-pruning
Orchestra-Research/AI-Research-SKILLs
290
通过 Wanda、SparseGPT 与 N:M 结构化剪枝,快速压缩大语言模型,提升稀疏度与推理速度,无需再训练即可部署在移动或边缘硬件。
查看详情
MoE模型训练与优化
moe-training
Orchestra-Research/AI-Research-SKILLs
199
本技能详细介绍了专家混合模型(MoE)的训练方法,涵盖Mixtral、DeepSeek-V3等前沿模型架构。它指导用户如何在计算资源有限的情况下,实现大规模模型能力的扩展和高效训练。核心内容包括Top-k路由机制、负载均衡、专家并行以及使用DeepSpeed和HuggingFace等框架进行优化,显著降低训练成本。
查看详情
极简GPT模型训练与学习系统
nanogpt
Orchestra-Research/AI-Research-SKILLs
467
nanoGPT是一个极简主义的GPT模型实现,专为教育和学习设计。它以简洁、可修改的代码复刻了GPT-2的核心架构,使用户能够从零开始理解整个Transformer流程。该框架支持完整的工作流,包括数据准备、模型训练和文本生成,非常适合学习NLP和深度学习原理的学生和研究人员。
查看详情
GPU驱动数据策划
nemo-curator
Orchestra-Research/AI-Research-SKILLs
226
NeMo Curator 依托 GPU 与 RAPIDS,为文本/图像/视频/音频等多模态提供质量筛选、模糊与语义去重、PII/NSFW 处理等步骤,快速清洗大规模训练数据。
查看详情
OpenRLHF训练套件
openrlhf-training
Orchestra-Research/AI-Research-SKILLs
474
一个基于Ray和vLLM的高性能RLHF训练框架,兼容PPO、GRPO、RLOO、DPO,借助ZeRO-3与分布式架构在多GPU集群上加速7B-70B+大模型的策略与奖励优化流程。
查看详情
闪电注意力优化器
optimizing-attention-flash
Orchestra-Research/AI-Research-SKILLs
55
Flash Attention 优化器在训练或运行长序列 Transformer 时提供 2-4 倍加速和 10-20 倍内存削减,适用于缓解注意力显存瓶颈与推理延迟,支持 PyTorch 原生 SDPA、flash-attn 库、H100 FP8 及滑动窗口注意力等场景。
查看详情
深度学习模型优化
optimizing-deep-learning-models
jeremylongshore/claude-code-plugins-plus-skills
370
通过分析模型结构、数据与指标,自动选择优化器、调度学习率和正则化方法,生成优化后的代码并评估准确率、训练时间与资源消耗,适合需要提升性能与效率的深度学习模型。
查看详情
Optuna 训练试验助手
optuna-study-creator
jeremylongshore/claude-code-plugins-plus-skills
56
自动触发的 ML 训练技能,识别“optuna study creator”相关请求后,即提供数据准备、模型训练、超参数调优与实验追踪等全流程指导,并给出生产级代码与校验。
查看详情
PEFT 高效微调指南
peft-fine-tuning
Orchestra-Research/AI-Research-SKILLs
71
介绍 HuggingFace PEFT 中 LoRA/QLoRA 微调流程,帮助在有限 GPU 上只训练小于 1% 参数并高效管理多适配器部署。
查看详情
Pubsub 主题配置指南
pubsub-topic-setup
jeremylongshore/claude-code-plugins-plus-skills
436
自动化指导 Google Cloud Pubsub 主题配置,提供最佳实践、生成可投产的配置与校验,服务于 GCP 技能训练与实践场景。
查看详情
PyTorch FSDP2 训练流程
pytorch-fsdp2
Orchestra-Research/AI-Research-SKILLs
439
指导在训练脚本中正确引入 PyTorch FSDP2 fully_shard,使底层模块逐层分片、配置混合精度与 CPU 卸载、构建依赖 DTensor 的优化器,并依靠分布式检查点处理超过单卡显存或需要 DeviceMesh 分片的模型。
查看详情
PyTorch Lightning 训练框架
pytorch-lightning
Orchestra-Research/AI-Research-SKILLs
235
PyTorch Lightning 提供高层训练框架,内置分布式训练(DDP/FSDP/DeepSpeed)、回调、检查点、日志与设备管理,帮助你从笔记本到多节点集群轻松运行高质量模型训练。
查看详情
上一页
1
2
3
4
5
6
7
8
...
12
13
14
下一页
语言
简体中文
English