登录
下载
Skill UI
浏览并发现
10271+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
AI训练
,共找到
77
条记录
默认排序
最新上传
最多下载
大型语言模型(LLM)实现与训练
implementing-llms-litgpt
Orchestra-Research/AI-Research-SKILLs
376
LitGPT提供了一个用于实现和训练超过20种前沿大型语言模型(如Llama, Gemma, Mistral)的工具。它支持完整的微调(Fine-tuning)、高效的LoRA适配以及从零开始的预训练流程。适用于需要清晰模型结构、学术理解或生产级部署的开发者。
查看详情
学习率调度助手
learning-rate-scheduler
jeremylongshore/claude-code-plugins-plus-skills
458
为机器学习训练中配置学习率调度器提供自动化指导,涵盖最佳实践、配置模式,以及 PyTorch、TensorFlow 和 Scikit-learn 的代码生成与验证。
查看详情
长上下文扩展技术
long-context
Orchestra-Research/AI-Research-SKILLs
140
通过 RoPE、YaRN、ALiBi 和位置插值等技术扩展 transformer 的上下文窗口,便于处理 32k-128k+ 令牌长文档、延长预训练模型的上下文能力,并实现更高效的位置编码与外推策略。
查看详情
多智能体MLOps管道编排
machine-learning-ops-ml-pipeline
sickn33/antigravity-awesome-skills
485
本技能旨在指导设计和实现一个完整的、生产级别的机器学习(ML)管道。它采用多智能体编排工作流,系统地覆盖了ML整个生命周期:包括数据摄取、特征工程、模型训练、代码优化和生产部署(MLOps),确保系统具备高可重复性、可监控性和高扩展性。
查看详情
混合精度训练助手
mixed-precision-trainer
jeremylongshore/claude-code-plugins-plus-skills
316
自动化提供混合精度机器学习训练指导,涵盖数据准备、模型训练、超参调优与实验追踪,生成可用代码与配置并进行校验。
查看详情
机器学习全生命周期流程管理
ml-pipeline-workflow
sickn33/antigravity-awesome-skills
282
本技能提供完整的MLOps管道编排指南,覆盖机器学习的整个生命周期。它指导用户从数据摄取、特征工程、模型训练,到系统级的模型验证和部署自动化,确保构建出可复现、高可用、可监控的生产级机器学习系统。
查看详情
Mlflow 追踪配置
mlflow-tracking-setup
jeremylongshore/claude-code-plugins-plus-skills
173
自动化协助配置 mlflow 实验追踪,提供最佳实践、生成配置与代码、并校验输出,支持训练流程的数据准备与模型调优。
查看详情
模型检查点管理器
model-checkpoint-manager
jeremylongshore/claude-code-plugins-plus-skills
441
为机器学习训练流程提供模型检查点管理的自动化指导,涵盖实践建议、代码示例与校验,助力实验稳定可复现。
查看详情
模型可解释性工具
model-explainability-tool
jeremylongshore/claude-code-plugins-plus-skills
121
在机器学习训练过程中,自动响应模型可解释性工具相关请求,提供分步实践、代码配置与验证建议,助力数据准备、调参和实验追踪等任务。
查看详情
LLM模型剪枝实用指南
model-pruning
Orchestra-Research/AI-Research-SKILLs
290
通过 Wanda、SparseGPT 与 N:M 结构化剪枝,快速压缩大语言模型,提升稀疏度与推理速度,无需再训练即可部署在移动或边缘硬件。
查看详情
MoE模型训练与优化
moe-training
Orchestra-Research/AI-Research-SKILLs
199
本技能详细介绍了专家混合模型(MoE)的训练方法,涵盖Mixtral、DeepSeek-V3等前沿模型架构。它指导用户如何在计算资源有限的情况下,实现大规模模型能力的扩展和高效训练。核心内容包括Top-k路由机制、负载均衡、专家并行以及使用DeepSpeed和HuggingFace等框架进行优化,显著降低训练成本。
查看详情
极简GPT模型训练与学习系统
nanogpt
Orchestra-Research/AI-Research-SKILLs
467
nanoGPT是一个极简主义的GPT模型实现,专为教育和学习设计。它以简洁、可修改的代码复刻了GPT-2的核心架构,使用户能够从零开始理解整个Transformer流程。该框架支持完整的工作流,包括数据准备、模型训练和文本生成,非常适合学习NLP和深度学习原理的学生和研究人员。
查看详情
上一页
1
2
3
4
5
6
7
下一页
语言
简体中文
English