登录
下载
Skill UI
浏览并发现
10245+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
AI训练
,共找到
150
条记录
默认排序
最新上传
最多下载
TensorBoard 可视化工具包
tensorboard
Orchestra-Research/AI-Research-SKILLs
130
TensorBoard 提供统一可视化界面,跟踪训练指标、调试模型、对比实验、观察网络结构并分析性能瓶颈,适用于 PyTorch 与 TensorFlow 训练流程。
查看详情
Tensorboard 可视化助手
tensorboard-visualizer
jeremylongshore/claude-code-plugins-plus-skills
113
在提到 tensorboard 可视化时自动激活,指导模型训练中的数据准备、调参和实验追踪,提供规范化配置与标准校验,确保可视化流程可用于生产。
查看详情
Tensorflow 模型训练助手
tensorflow-model-trainer
jeremylongshore/claude-code-plugins-plus-skills
307
自动激活的 Tensorflow 模型训练技能,覆盖数据准备、模型训练、超参数调优与实验追踪,并生成生产级代码与校验。
查看详情
PyTorch原生智能体RL训练框架
torchforge-rl-training
Orchestra-Research/AI-Research-SKILLs
135
torchforge是Meta推出的用于智能体强化学习(RL)的PyTorch原生框架。它将核心的RL算法与复杂的分布式基础设施进行了彻底分离。用户可以专注于算法的快速实验和开发,无需担心底层分布式训练、权重同步等复杂问题,支持从单卡到大规模集群的扩展训练。
查看详情
训练测试集切分器
train-test-splitter
jeremylongshore/claude-code-plugins-plus-skills
383
该技能自动响应涉及训练/测试集划分的请求,提供行业级指导、实用代码与配置建议,并帮助验证 PyTorch、TensorFlow 或 sklearn 流程中的数据准备与模型训练环节。
查看详情
Megatron-Core大型语言模型训练
training-llms-megatron
Orchestra-Research/AI-Research-SKILLs
135
基于 Megatron-Core 提供端到端流程,可训练 2B-462B 参数的大语言模型,使用张量/流水/专家/上下文并行和 H100 上的高效资源利用。
查看详情
机器学习模型训练
training-machine-learning-models
jeremylongshore/claude-code-plugins-plus-skills
491
自动化完成机器学习模型的训练流程,包括数据分析、模型类型选择、参数配置、交叉验证训练、性能评估以及生成可复用的模型产物,适用于需要训练或评估数据集的场景。
查看详情
GPU实例管理与机器学习工作流
vastai-core-workflow-a
jeremylongshore/claude-code-plugins-plus-skills
443
这是一个完整的GPU计算资源工作流。它帮助用户在Vast.ai上执行端到端的工作流:从根据规格和价格搜索最佳GPU资源,到创建实例,执行复杂的模型训练或推理任务,收集模型成果,并最重要的是销毁实例以停止计费。适用于AI模型训练和计算任务。
查看详情
Vast.ai分布式训练与成本管理
vastai-core-workflow-b
jeremylongshore/claude-code-plugins-plus-skills
439
这是一个高级工作流,用于在Vast.ai上编排复杂的、多节点的GPU集群。它专为大规模分布式机器学习训练设计,能自动处理Spot机中断和使用检查点进行作业恢复。同时,该工作流提供全面的成本分析功能,帮助用户跟踪账单历史,优化GPU支出,并安全地销毁集群以停止计费。
查看详情
Vast.ai GPU成本优化指南
vastai-cost-tuning
jeremylongshore/claude-code-plugins-plus-skills
191
本工具包旨在帮助用户优化Vast.ai上的GPU云资源使用成本。它提供了选择成本效益最高GPU型号、利用抢占式(Spot)实例以及设置自动销毁机制的完整指南。通过检测闲置计算资源和监控运行费用,确保AI模型训练和推理作业能够高效、经济地完成。
查看详情
机器学习训练数据安全管理
vastai-data-handling
jeremylongshore/claude-code-plugins-plus-skills
158
本指南提供了在云端GPU实例(如Vast.ai)上安全管理训练数据和模型工件的完整流程。它涵盖了数据传输(SCP、压缩、云存储)、AES-256加密实现、模型检查点到S3的持久化,以及实例销毁前的安全数据清理,确保了整个机器学习项目的合规性和数据完整性。
查看详情
Vast.ai GPU实例故障处理手册
vastai-incident-runbook
jeremylongshore/claude-code-plugins-plus-skills
199
本手册提供了一套完整的Vast.ai云GPU实例故障应急响应流程。它系统性地涵盖了包括抢占、训练任务崩溃和GPU硬件故障等常见场景。用户可以遵循手册中的排查、缓解、恢复和事后分析步骤,最大程度地减少停机时间,保障计算任务的持续性。
查看详情
上一页
1
2
3
4
5
6
7
8
9
10
11
12
13
下一页
语言
简体中文
English