下载

Skill UI

浏览并发现 10271+ 精选技能

全部编程开发人工智能设计创意产品商业数据科学市场营销职场通用效率工具硬件工程语言学习

搜索 AI训练，共找到 77 条记录

默认排序最新上传最多下载

大型语言模型（LLM）实现与训练

implementing-llms-litgpt

Orchestra-Research/AI-Research-SKILLs

LitGPT提供了一个用于实现和训练超过20种前沿大型语言模型（如Llama, Gemma, Mistral）的工具。它支持完整的微调（Fine-tuning）、高效的LoRA适配以及从零开始的预训练流程。适用于需要清晰模型结构、学术理解或生产级部署的开发者。

学习率调度助手

learning-rate-scheduler

jeremylongshore/claude-code-plugins-plus-skills

为机器学习训练中配置学习率调度器提供自动化指导，涵盖最佳实践、配置模式，以及 PyTorch、TensorFlow 和 Scikit-learn 的代码生成与验证。

长上下文扩展技术

Orchestra-Research/AI-Research-SKILLs

通过 RoPE、YaRN、ALiBi 和位置插值等技术扩展 transformer 的上下文窗口，便于处理 32k-128k+ 令牌长文档、延长预训练模型的上下文能力，并实现更高效的位置编码与外推策略。

多智能体MLOps管道编排

machine-learning-ops-ml-pipeline

sickn33/antigravity-awesome-skills

本技能旨在指导设计和实现一个完整的、生产级别的机器学习（ML）管道。它采用多智能体编排工作流，系统地覆盖了ML整个生命周期：包括数据摄取、特征工程、模型训练、代码优化和生产部署（MLOps），确保系统具备高可重复性、可监控性和高扩展性。

混合精度训练助手

mixed-precision-trainer

jeremylongshore/claude-code-plugins-plus-skills

自动化提供混合精度机器学习训练指导，涵盖数据准备、模型训练、超参调优与实验追踪，生成可用代码与配置并进行校验。

机器学习全生命周期流程管理

ml-pipeline-workflow

sickn33/antigravity-awesome-skills

本技能提供完整的MLOps管道编排指南，覆盖机器学习的整个生命周期。它指导用户从数据摄取、特征工程、模型训练，到系统级的模型验证和部署自动化，确保构建出可复现、高可用、可监控的生产级机器学习系统。

Mlflow 追踪配置

mlflow-tracking-setup

jeremylongshore/claude-code-plugins-plus-skills

自动化协助配置 mlflow 实验追踪，提供最佳实践、生成配置与代码、并校验输出，支持训练流程的数据准备与模型调优。

模型检查点管理器

model-checkpoint-manager

jeremylongshore/claude-code-plugins-plus-skills

为机器学习训练流程提供模型检查点管理的自动化指导，涵盖实践建议、代码示例与校验，助力实验稳定可复现。

模型可解释性工具

model-explainability-tool

jeremylongshore/claude-code-plugins-plus-skills

在机器学习训练过程中，自动响应模型可解释性工具相关请求，提供分步实践、代码配置与验证建议，助力数据准备、调参和实验追踪等任务。

LLM模型剪枝实用指南

Orchestra-Research/AI-Research-SKILLs

通过 Wanda、SparseGPT 与 N:M 结构化剪枝，快速压缩大语言模型，提升稀疏度与推理速度，无需再训练即可部署在移动或边缘硬件。

MoE模型训练与优化

Orchestra-Research/AI-Research-SKILLs

本技能详细介绍了专家混合模型（MoE）的训练方法，涵盖Mixtral、DeepSeek-V3等前沿模型架构。它指导用户如何在计算资源有限的情况下，实现大规模模型能力的扩展和高效训练。核心内容包括Top-k路由机制、负载均衡、专家并行以及使用DeepSpeed和HuggingFace等框架进行优化，显著降低训练成本。

极简GPT模型训练与学习系统

Orchestra-Research/AI-Research-SKILLs

nanoGPT是一个极简主义的GPT模型实现，专为教育和学习设计。它以简洁、可修改的代码复刻了GPT-2的核心架构，使用户能够从零开始理解整个Transformer流程。该框架支持完整的工作流，包括数据准备、模型训练和文本生成，非常适合学习NLP和深度学习原理的学生和研究人员。

上一页 1 234 5 6 7 下一页

语言