登录
下载
Skill UI
浏览并发现
10321+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
vllm
,共找到
15
条记录
默认排序
最新上传
最多下载
CoreWeave GPU工作负载部署
coreweave-hello-world
jeremylongshore/claude-code-plugins-plus-skills
436
本指南提供在CoreWeave平台上使用Kubernetes(kubectl)部署GPU工作负载的教程。内容包括部署vLLM服务进行大型语言模型(LLM)推理测试,以及运行CUDA批量作业进行性能基准测试。适用于首次部署GPU任务或验证集群访问的场景。
查看详情
CoreWeave GPU性能调优指南
coreweave-performance-tuning
jeremylongshore/claude-code-plugins-plus-skills
494
本指南提供了在CoreWeave平台上优化GPU推理性能的专家策略。内容涵盖了根据不同工作负载(如LLM推理、图像生成、模型训练)选择最佳GPU、使用vLLM实现连续批处理优化,以及基于指标的HPA自动扩缩容配置。帮助用户最大化GPU利用率,降低推理延迟,提升AI模型部署效率。
查看详情
CoreWeave GPU云参考架构
coreweave-reference-architecture
jeremylongshore/claude-code-plugins-plus-skills
347
本参考架构提供了一套在CoreWeave GPU云上部署机器学习模型的完整蓝图。它详细描述了多模型服务(如vLLM, TGI)的Kubernetes部署结构、共享持久化存储(PVC)以及基于KServe/Knative的自动扩缩容机制。适用于设计鲁棒的MLOps流程、规划高性能多模型推理服务,或建立标准的GPU云部署规范。
查看详情
上一页
1
2
语言
简体中文
English