登录
下载
Skill UI
浏览并发现
10578+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
E-E-A-T
,共找到
10577
条记录
默认排序
最新上传
最多下载
CoreWeave KServe GPU推理服务部署
coreweave-core-workflow-a
jeremylongshore/claude-code-plugins-plus-skills
155
本指南详细介绍了如何在CoreWeave上使用KServe部署生产级机器学习推理服务。内容涵盖了配置GPU调度、实现自动扩缩容以及设置冷启动优化的流程。适用于需要部署大型语言模型(LLMs)或其他复杂AI模型的MLOps工程师。
查看详情
CoreWeave分布式GPU训练工作流
coreweave-core-workflow-b
jeremylongshore/claude-code-plugins-plus-skills
142
本指南详细介绍了如何在CoreWeave平台上运行大规模的分布式GPU训练任务。它涵盖了单节点多GPU配置和多节点训练,支持PyTorch DDP,是进行大型语言模型(LLM)微调或需要高性能计算集群的深度学习模型训练的推荐工作流。
查看详情
CoreWeave GPU成本优化指南
coreweave-cost-tuning
jeremylongshore/claude-code-plugins-plus-skills
258
本指南提供了一套全面的策略,用于优化CoreWeave上的云GPU资源支出。它涵盖了从根据模型需求进行精细化资源配置(Right-sizing),到为开发环境实施从零扩展(Scale-to-Zero),以及利用量化技术(如AWQ)等多个维度,帮助用户在确保高性能的同时,实现AI/ML工作负载的最大化成本节约。
查看详情
核心AI数据管理与合规
coreweave-data-handling
jeremylongshore/claude-code-plugins-plus-skills
148
用于在GPU云工作负载中管理大型数据集、模型权重和训练数据。它涵盖了数据生命周期管理的全流程,包括通过Kubernetes PVC安全导入、合规导出和数据验证。确保数据处理过程符合行业最佳实践、加密标准(AES-256)和数据安全合规要求。
查看详情
CoreWeave诊断信息收集包
coreweave-debug-bundle
jeremylongshore/claude-code-plugins-plus-skills
271
本工具用于收集CoreWeave集群的全面诊断信息,包括GPU节点状态、Kubernetes Pod日志、集群事件和资源分配情况。它将所有关键的系统诊断数据打包成一个归档文件,极大地简化了提交技术支持工单的流程,便于快速定位容器化环境下的故障根源。
查看详情
CoreWeave GPU推理服务部署
coreweave-deploy-integration
jeremylongshore/claude-code-plugins-plus-skills
146
本技能旨在指导用户在CoreWeave Kubernetes集群上部署和管理GPU加速的AI推理服务。内容涵盖了从Docker容器化、配置GPU资源限制(如A100/H100),到设置健康检查和执行滚动更新的全流程最佳实践,适用于大规模多模型推理和云端AI工作负载管理。
查看详情
CoreWeave企业级RBAC权限管理
coreweave-enterprise-rbac
jeremylongshore/claude-code-plugins-plus-skills
280
本技能用于配置CoreWeave平台上的企业级RBAC(基于角色访问控制)和命名空间隔离策略。它指导用户如何为多团队的GPU工作负载设置严格的资源配额和权限边界,有效防止资源争抢(noisy-neighbor),实现资源隔离,并满足企业级的安全和合规性要求。
查看详情
CoreWeave GPU工作负载部署
coreweave-hello-world
jeremylongshore/claude-code-plugins-plus-skills
436
本指南提供在CoreWeave平台上使用Kubernetes(kubectl)部署GPU工作负载的教程。内容包括部署vLLM服务进行大型语言模型(LLM)推理测试,以及运行CUDA批量作业进行性能基准测试。适用于首次部署GPU任务或验证集群访问的场景。
查看详情
CoreWeave故障排查手册
coreweave-incident-runbook
jeremylongshore/claude-code-plugins-plus-skills
430
这是一份用于CoreWeave平台的关键生产环境故障排除手册。它提供了应对GPU工作负载故障、推理服务宕机或Kubernetes资源问题的结构化步骤,指导用户检查Pod状态、节点健康和模型加载错误,以实现快速恢复服务。
查看详情
CoreWeave K8s环境设置与认证
coreweave-install-auth
jeremylongshore/claude-code-plugins-plus-skills
349
本指南提供了一套完整的CoreWeave Kubernetes服务(CKS)配置流程。内容包括如何下载kubeconfig文件、设置API令牌以及使用`kubectl`命令验证GPU资源访问。适用于所有需要在裸金属GPU集群上部署AI/ML工作负载的用户。
查看详情
云端机器学习工作负载迁移指南
coreweave-migration-deep-dive
jeremylongshore/claude-code-plugins-plus-skills
205
本技能包详细指导用户如何将机器学习工作负载(包括推理服务和训练管道)从AWS/GCP/Azure等大型云平台迁移到CoreWeave GPU云。内容涵盖成本对比、容器化步骤、Kubernetes配置适配和分阶段部署,帮助用户确保迁移过程平稳、高效且具成本效益。
查看详情
CoreWeave多环境部署配置
coreweave-multi-env-setup
jeremylongshore/claude-code-plugins-plus-skills
252
本技能旨在指导用户在CoreWeave云平台上配置和管理多环境(开发、预发布、生产)的GPU基础设施。它通过隔离Kubernetes命名空间,为每个环境设置独立的GPU配额、扩缩容策略和访问控制,确保AI/ML工作负载的资源安全与稳定性,支持从开发到生产的完整推广流程。
查看详情
上一页
1
2
3
...
657
658
659
660
661
662
663
...
880
881
882
下一页
语言
简体中文
English