登录
下载
Skill UI
浏览并发现
9185+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
自动扩缩容
,共找到
6
条记录
默认排序
最新上传
最多下载
Modal 云 GPU 运行管家
serverless-modal
wanshuiyin/Auto-claude-code-research-in-sleep
172
基于 Modal 的零配置 GPU 云,快速运行训练/微调/推理/批处理,自动扩缩容、管理秘钥、及时停止计费,适合无本地 GPU 的调试和实验。
查看详情
CAST AI性能调优指南
castai-performance-tuning
jeremylongshore/claude-code-plugins-plus-skills
145
本技能提供了一套全面的指导,用于优化CAST AI的核心性能指标。内容涵盖节点预配速度、自动扩缩容的响应速度,以及多集群仪表板的API调用效率。通过配置资源预留(Headroom)、选择最佳实例族群和调优清理机制,帮助用户提升系统的可用性和成本效益。
查看详情
CAST AI自动扩缩容配置
castai-core-workflow-a
jeremylongshore/claude-code-plugins-plus-skills
492
本工作流指导用户配置CAST AI的自动扩缩容策略,实现Kubernetes集群的最佳成本管理和资源利用。内容涵盖启用竞价实例(Spot Instances)、设置节点下沉/驱逐规则、定义集群限制,并通过Terraform创建特定工作负载的节点模板,确保资源分配的稳定性和成本效益。
查看详情
CoreWeave KServe GPU推理服务部署
coreweave-core-workflow-a
jeremylongshore/claude-code-plugins-plus-skills
155
本指南详细介绍了如何在CoreWeave上使用KServe部署生产级机器学习推理服务。内容涵盖了配置GPU调度、实现自动扩缩容以及设置冷启动优化的流程。适用于需要部署大型语言模型(LLMs)或其他复杂AI模型的MLOps工程师。
查看详情
CoreWeave GPU性能调优指南
coreweave-performance-tuning
jeremylongshore/claude-code-plugins-plus-skills
494
本指南提供了在CoreWeave平台上优化GPU推理性能的专家策略。内容涵盖了根据不同工作负载(如LLM推理、图像生成、模型训练)选择最佳GPU、使用vLLM实现连续批处理优化,以及基于指标的HPA自动扩缩容配置。帮助用户最大化GPU利用率,降低推理延迟,提升AI模型部署效率。
查看详情
CoreWeave GPU云参考架构
coreweave-reference-architecture
jeremylongshore/claude-code-plugins-plus-skills
347
本参考架构提供了一套在CoreWeave GPU云上部署机器学习模型的完整蓝图。它详细描述了多模型服务(如vLLM, TGI)的Kubernetes部署结构、共享持久化存储(PVC)以及基于KServe/Knative的自动扩缩容机制。适用于设计鲁棒的MLOps流程、规划高性能多模型推理服务,或建立标准的GPU云部署规范。
查看详情
1
语言
简体中文
English