登录
下载
Skill UI
浏览并发现
10401+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
vllm
,共找到
3
条记录
默认排序
最新上传
最多下载
Mistral AI 生产环境部署指南
mistral-deploy-integration
jeremylongshore/claude-code-plugins-plus-skills
243
本指南详细介绍了 Mistral AI 应用部署到各种云平台和容器环境的完整流程。支持 Vercel、Docker、Cloud Run 和自托管 vLLM 等多种生产环境。内容涵盖了安全密钥管理、平台特定配置和完整的部署步骤,帮助开发者将 AI 原型快速、安全地部署为可扩展的生产服务。
查看详情
高吞吐量大模型服务
serving-llms-vllm
Orchestra-Research/AI-Research-SKILLs
422
使用 vLLM 的分块注意力、连续批处理、量化与张量并行能力,为 OpenAI 兼容接口提供高吞吐量的生产级大模型服务,兼顾延迟、GPU 利用和扩展性。
查看详情
CoreWeave GPU性能调优指南
coreweave-performance-tuning
jeremylongshore/claude-code-plugins-plus-skills
494
本指南提供了在CoreWeave平台上优化GPU推理性能的专家策略。内容涵盖了根据不同工作负载(如LLM推理、图像生成、模型训练)选择最佳GPU、使用vLLM实现连续批处理优化,以及基于指标的HPA自动扩缩容配置。帮助用户最大化GPU利用率,降低推理延迟,提升AI模型部署效率。
查看详情
1
语言
简体中文
English