登录
下载
Skill UI
浏览并发现
10321+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
H100
,共找到
9
条记录
默认排序
最新上传
最多下载
闪电注意力优化器
optimizing-attention-flash
Orchestra-Research/AI-Research-SKILLs
55
Flash Attention 优化器在训练或运行长序列 Transformer 时提供 2-4 倍加速和 10-20 倍内存削减,适用于缓解注意力显存瓶颈与推理延迟,支持 PyTorch 原生 SDPA、flash-attn 库、H100 FP8 及滑动窗口注意力等场景。
查看详情
Megatron-Core大型语言模型训练
training-llms-megatron
Orchestra-Research/AI-Research-SKILLs
135
基于 Megatron-Core 提供端到端流程,可训练 2B-462B 参数的大语言模型,使用张量/流水/专家/上下文并行和 H100 上的高效资源利用。
查看详情
无服务器GPU云平台:AI训练与推理
serverless-modal
wanshuiyin/Auto-claude-code-research-in-sleep
281
这是一个零配置的无服务器GPU云平台,专为运行复杂的机器学习工作负载而设计,包括模型训练、微调和实时推理。它无需复杂的环境设置(无需SSH或Docker),支持本地优先和自动弹性伸缩,适用于所有高性能GPU。非常适合需要可扩展、高效率远程计算资源的AI工程师和数据科学家。
查看详情
Modal:AI/ML无服务器云平台
modal
K-Dense-AI/scientific-agent-skills
392
Modal是一个专为AI和机器学习工作负载设计的无服务器云平台。它允许用户部署、服务和扩展复杂的模型(如大型语言模型),而无需手动管理底层基础设施。核心功能包括按需接入高端GPU资源、无服务器函数自动伸缩、提供持久化存储,并且整个基础设施都可以纯代码定义,极大简化了开发流程。
查看详情
CoreWeave GPU迁移与升级
coreweave-upgrade-migration
jeremylongshore/claude-code-plugins-plus-skills
157
该工具用于管理和自动化CoreWeave云基础设施的升级与迁移过程。它支持执行GPU型号升级(如A100到H100)、CUDA版本兼容性检查,并利用Kubernetes API审计部署、检测过时实例,确保集群平稳过渡。
查看详情
CoreWeave分布式GPU训练工作流
coreweave-core-workflow-b
jeremylongshore/claude-code-plugins-plus-skills
142
本指南详细介绍了如何在CoreWeave平台上运行大规模的分布式GPU训练任务。它涵盖了单节点多GPU配置和多节点训练,支持PyTorch DDP,是进行大型语言模型(LLM)微调或需要高性能计算集群的深度学习模型训练的推荐工作流。
查看详情
CoreWeave GPU推理服务部署
coreweave-deploy-integration
jeremylongshore/claude-code-plugins-plus-skills
146
本技能旨在指导用户在CoreWeave Kubernetes集群上部署和管理GPU加速的AI推理服务。内容涵盖了从Docker容器化、配置GPU资源限制(如A100/H100),到设置健康检查和执行滚动更新的全流程最佳实践,适用于大规模多模型推理和云端AI工作负载管理。
查看详情
CoreWeave GPU工作负载部署
coreweave-hello-world
jeremylongshore/claude-code-plugins-plus-skills
436
本指南提供在CoreWeave平台上使用Kubernetes(kubectl)部署GPU工作负载的教程。内容包括部署vLLM服务进行大型语言模型(LLM)推理测试,以及运行CUDA批量作业进行性能基准测试。适用于首次部署GPU任务或验证集群访问的场景。
查看详情
CoreWeave GPU工作负载模式
coreweave-sdk-patterns
jeremylongshore/claude-code-plugins-plus-skills
395
该SDK提供了一系列生产级的Python模式,用于在CoreWeave平台上管理GPU计算任务。它帮助用户定义GPU资源规格、设置节点亲和性,并生成完整的Kubernetes部署模板。适用于构建稳定可靠的AI推理客户端、管理GPU基础设施或自动化复杂的AI工作流。
查看详情
1
语言
简体中文
English