登录
下载
Skill UI
浏览并发现
9785+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
训练
,共找到
84
条记录
默认排序
最新上传
最多下载
MoE模型训练与优化
moe-training
Orchestra-Research/AI-Research-SKILLs
199
本技能详细介绍了专家混合模型(MoE)的训练方法,涵盖Mixtral、DeepSeek-V3等前沿模型架构。它指导用户如何在计算资源有限的情况下,实现大规模模型能力的扩展和高效训练。核心内容包括Top-k路由机制、负载均衡、专家并行以及使用DeepSpeed和HuggingFace等框架进行优化,显著降低训练成本。
查看详情
极简GPT模型训练与学习系统
nanogpt
Orchestra-Research/AI-Research-SKILLs
467
nanoGPT是一个极简主义的GPT模型实现,专为教育和学习设计。它以简洁、可修改的代码复刻了GPT-2的核心架构,使用户能够从零开始理解整个Transformer流程。该框架支持完整的工作流,包括数据准备、模型训练和文本生成,非常适合学习NLP和深度学习原理的学生和研究人员。
查看详情
OpenRLHF训练套件
openrlhf-training
Orchestra-Research/AI-Research-SKILLs
474
一个基于Ray和vLLM的高性能RLHF训练框架,兼容PPO、GRPO、RLOO、DPO,借助ZeRO-3与分布式架构在多GPU集群上加速7B-70B+大模型的策略与奖励优化流程。
查看详情
深度学习模型优化
optimizing-deep-learning-models
jeremylongshore/claude-code-plugins-plus-skills
370
通过分析模型结构、数据与指标,自动选择优化器、调度学习率和正则化方法,生成优化后的代码并评估准确率、训练时间与资源消耗,适合需要提升性能与效率的深度学习模型。
查看详情
PEFT 高效微调指南
peft-fine-tuning
Orchestra-Research/AI-Research-SKILLs
71
介绍 HuggingFace PEFT 中 LoRA/QLoRA 微调流程,帮助在有限 GPU 上只训练小于 1% 参数并高效管理多适配器部署。
查看详情
PyTorch模型训练助手
pytorch-model-trainer
jeremylongshore/claude-code-plugins-plus-skills
381
自动化 PyTorch 训练流程,提供数据准备、模型配置、超参调优与实验跟踪等建议,遵循行业最佳实践,适合需要快速搭建训练流水的使用场景。
查看详情
PyTorch模型因果干预
pyvene-interventions
Orchestra-Research/AI-Research-SKILLs
110
pyvene是一个用于在PyTorch模型上执行因果干预的声明式框架。它支持激活打补丁、因果追踪(ROME风格)和交替干预训练等高级实验。适用于需要测试模型因果假设、深入理解模型组件工作机制或确保可复现性的AI研究场景。
查看详情
LLM 量化优化工具
quantizing-models-bitsandbytes
Orchestra-Research/AI-Research-SKILLs
95
使用 bitsandbytes 将 HuggingFace 大模型量化到 8 位或 4 位,显存降低 50%-75%,并兼容 QLoRA 以及 8 位优化器,适合显存受限时快速部署与训练。
查看详情
RWKV 混合架构
rwkv-architecture
Orchestra-Research/AI-Research-SKILLs
253
RWKV 是结合 Transformer 训练与 RNN 推理的混合架构,提供线性时间推理、无限上下文与零 KV 缓存,可在流式或超长上下文场景中用 CUDA/CPU 低内存部署。
查看详情
计算机视觉生产级工程技能
senior-computer-vision
alirezarezvani/claude-skills
257
涵盖了从基础模型到生产部署的完整计算机视觉AI全流程技能。掌握目标检测(YOLO、Faster R-CNN)、实例/语义分割(Mask R-CNN、SAM)等核心技术,并熟练运用PyTorch进行模型训练,最终通过ONNX和TensorRT等工具优化模型,实现边缘或云端设备的稳定部署。
查看详情
句向量嵌入框架
sentence-transformers
Orchestra-Research/AI-Research-SKILLs
326
Sentence Transformers 提供 5000+ 预训练模型,可生成句、文本与图像嵌入,支持 RAG、语义搜索、聚类、多语言与多模态,适合本地生产环境使用。
查看详情
实验追踪配置助手
setting-up-experiment-tracking
jeremylongshore/claude-code-plugins-plus-skills
325
自动化配置 MLflow 或 W&B 的实验追踪,设置环境、启动服务,并提供记录参数、指标与产物的代码示例,保持模型训练可复现且便于对比。
查看详情
上一页
1
2
3
4
5
6
7
下一页
语言
简体中文
English