登录
下载
Skill UI
浏览并发现
9688+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
ML训练
,共找到
8
条记录
默认排序
最新上传
最多下载
生产级机器学习管道与MLOps
ml-pipeline
Jeffallan/claude-skills
488
掌握从数据摄取到模型部署的完整机器学习生命周期。该技能涵盖使用Kubeflow、Airflow等编排工具构建健壮的生产级MLOps管道。核心能力包括使用Feast实现特征存储、严格的数据验证、实验跟踪(如MLflow)、模型注册和自动化部署,确保模型训练流程的端到端自动化和可复现性。
查看详情
PyTorch Lightning 训练框架
pytorch-lightning
Orchestra-Research/AI-Research-SKILLs
235
PyTorch Lightning 提供高层训练框架,内置分布式训练(DDP/FSDP/DeepSpeed)、回调、检查点、日志与设备管理,帮助你从笔记本到多节点集群轻松运行高质量模型训练。
查看详情
SkyPilot 多云作业编排
skypilot-multi-cloud-orchestration
Orchestra-Research/AI-Research-SKILLs
376
SkyPilot 提供面向机器学习的多云编排,自动选取最优云/区域、恢复抢占型实例、管理多节点训练与模型服务,帮助团队降低 GPU 费用并规避供应商锁定。
查看详情
Vast.ai 安全基础与最佳实践
vastai-security-basics
jeremylongshore/claude-code-plugins-plus-skills
489
本技能提供了使用Vast.ai云环境时的安全最佳实践指南。内容涵盖API密钥管理、强化SSH访问安全、数据销毁前的安全清理,以及网络传输规范。适用于构建和维护安全、可靠的AI开发和模型训练环境。
查看详情
PyTorch Lightning 框架
pytorch-lightning
K-Dense-AI/claude-scientific-skills
179
PyTorch Lightning 框架将 PyTorch 代码组织为 LightningModule/DataModule、Trainer、回调、日志与分布式策略,便于多 GPU/TPU 训练、实验记录和项目级别扩展。
查看详情
PyTorch Lightning 框架
pytorch-lightning
K-Dense-AI/scientific-agent-skills
102
PyTorch Lightning 框架将 PyTorch 代码组织为 LightningModule/DataModule、Trainer、回调、日志与分布式策略,便于多 GPU/TPU 训练、实验记录和项目级别扩展。
查看详情
CoreWeave生产部署检查清单
coreweave-prod-checklist
jeremylongshore/claude-code-plugins-plus-skills
232
这份清单用于指导将GPU工作负载(如推理服务或模型训练)从开发环境迁移到CoreWeave生产环境的全部关键步骤。它系统地覆盖了自动伸缩、资源配置、安全策略、持久化存储、性能监控和故障回滚等MLOps及DevOps最佳实践。
查看详情
CoreWeave GPU工作负载安全配置
coreweave-security-basics
jeremylongshore/claude-code-plugins-plus-skills
200
本技能旨在指导用户如何在CoreWeave平台上安全部署GPU工作负载。涵盖了从API密钥管理、RBAC权限控制到网络策略(NetworkPolicy)的全面安全最佳实践。帮助用户有效隔离命名空间、保护模型权重和敏感训练数据,确保云原生环境的高安全性。
查看详情
1
语言
简体中文
English