下载

Skill UI

浏览并发现 10321+ 精选技能

全部编程开发人工智能设计创意产品商业数据科学市场营销职场通用效率工具硬件工程语言学习

搜索 H100 ，共找到 9 条记录

默认排序最新上传最多下载

闪电注意力优化器

optimizing-attention-flash

Orchestra-Research/AI-Research-SKILLs

Flash Attention 优化器在训练或运行长序列 Transformer 时提供 2-4 倍加速和 10-20 倍内存削减，适用于缓解注意力显存瓶颈与推理延迟，支持 PyTorch 原生 SDPA、flash-attn 库、H100 FP8 及滑动窗口注意力等场景。

Megatron-Core大型语言模型训练

training-llms-megatron

Orchestra-Research/AI-Research-SKILLs

基于 Megatron-Core 提供端到端流程，可训练 2B-462B 参数的大语言模型，使用张量/流水/专家/上下文并行和 H100 上的高效资源利用。

无服务器GPU云平台：AI训练与推理

serverless-modal

wanshuiyin/Auto-claude-code-research-in-sleep

这是一个零配置的无服务器GPU云平台，专为运行复杂的机器学习工作负载而设计，包括模型训练、微调和实时推理。它无需复杂的环境设置（无需SSH或Docker），支持本地优先和自动弹性伸缩，适用于所有高性能GPU。非常适合需要可扩展、高效率远程计算资源的AI工程师和数据科学家。

Modal：AI/ML无服务器云平台

K-Dense-AI/scientific-agent-skills

Modal是一个专为AI和机器学习工作负载设计的无服务器云平台。它允许用户部署、服务和扩展复杂的模型（如大型语言模型），而无需手动管理底层基础设施。核心功能包括按需接入高端GPU资源、无服务器函数自动伸缩、提供持久化存储，并且整个基础设施都可以纯代码定义，极大简化了开发流程。

CoreWeave GPU迁移与升级

coreweave-upgrade-migration

jeremylongshore/claude-code-plugins-plus-skills

该工具用于管理和自动化CoreWeave云基础设施的升级与迁移过程。它支持执行GPU型号升级（如A100到H100）、CUDA版本兼容性检查，并利用Kubernetes API审计部署、检测过时实例，确保集群平稳过渡。

CoreWeave分布式GPU训练工作流

coreweave-core-workflow-b

jeremylongshore/claude-code-plugins-plus-skills

本指南详细介绍了如何在CoreWeave平台上运行大规模的分布式GPU训练任务。它涵盖了单节点多GPU配置和多节点训练，支持PyTorch DDP，是进行大型语言模型（LLM）微调或需要高性能计算集群的深度学习模型训练的推荐工作流。

CoreWeave GPU推理服务部署

coreweave-deploy-integration

jeremylongshore/claude-code-plugins-plus-skills

本技能旨在指导用户在CoreWeave Kubernetes集群上部署和管理GPU加速的AI推理服务。内容涵盖了从Docker容器化、配置GPU资源限制（如A100/H100），到设置健康检查和执行滚动更新的全流程最佳实践，适用于大规模多模型推理和云端AI工作负载管理。

CoreWeave GPU工作负载部署

coreweave-hello-world

jeremylongshore/claude-code-plugins-plus-skills

本指南提供在CoreWeave平台上使用Kubernetes（kubectl）部署GPU工作负载的教程。内容包括部署vLLM服务进行大型语言模型（LLM）推理测试，以及运行CUDA批量作业进行性能基准测试。适用于首次部署GPU任务或验证集群访问的场景。

CoreWeave GPU工作负载模式

coreweave-sdk-patterns

jeremylongshore/claude-code-plugins-plus-skills

该SDK提供了一系列生产级的Python模式，用于在CoreWeave平台上管理GPU计算任务。它帮助用户定义GPU资源规格、设置节点亲和性，并生成完整的Kubernetes部署模板。适用于构建稳定可靠的AI推理客户端、管理GPU基础设施或自动化复杂的AI工作流。

1

语言