登录
下载
Skill UI
浏览并发现
9747+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
ML部署
,共找到
46
条记录
默认排序
最新上传
最多下载
Transformers.js JavaScript 机器学习
transformers-js
sickn33/antigravity-awesome-skills
337
在浏览器或 Node.js 中通过 Transformers.js 运行 Hugging Face 模型,涵盖文本、图像与语音任务,提供 Pipeline 抽象、设备选择与量化选项,可在客户端部署多模态推理,无需后端。
查看详情
无服务器AI/ML云平台
modal
K-Dense-AI/scientific-agent-skills
139
Modal是一个无服务器云平台,专为AI/ML工作负载设计,允许用户直接用Python代码运行复杂的计算任务。它提供按需的GPU算力、自动扩缩容的函数调用、自定义容器构建和持久化存储。适用于模型部署、训练推理、构建高性能API和定时任务。
查看详情
CoreWeave KServe GPU推理服务部署
coreweave-core-workflow-a
jeremylongshore/claude-code-plugins-plus-skills
155
本指南详细介绍了如何在CoreWeave上使用KServe部署生产级机器学习推理服务。内容涵盖了配置GPU调度、实现自动扩缩容以及设置冷启动优化的流程。适用于需要部署大型语言模型(LLMs)或其他复杂AI模型的MLOps工程师。
查看详情
CoreWeave K8s环境设置与认证
coreweave-install-auth
jeremylongshore/claude-code-plugins-plus-skills
349
本指南提供了一套完整的CoreWeave Kubernetes服务(CKS)配置流程。内容包括如何下载kubeconfig文件、设置API令牌以及使用`kubectl`命令验证GPU资源访问。适用于所有需要在裸金属GPU集群上部署AI/ML工作负载的用户。
查看详情
云端机器学习工作负载迁移指南
coreweave-migration-deep-dive
jeremylongshore/claude-code-plugins-plus-skills
205
本技能包详细指导用户如何将机器学习工作负载(包括推理服务和训练管道)从AWS/GCP/Azure等大型云平台迁移到CoreWeave GPU云。内容涵盖成本对比、容器化步骤、Kubernetes配置适配和分阶段部署,帮助用户确保迁移过程平稳、高效且具成本效益。
查看详情
CoreWeave GPU云参考架构
coreweave-reference-architecture
jeremylongshore/claude-code-plugins-plus-skills
347
本参考架构提供了一套在CoreWeave GPU云上部署机器学习模型的完整蓝图。它详细描述了多模型服务(如vLLM, TGI)的Kubernetes部署结构、共享持久化存储(PVC)以及基于KServe/Knative的自动扩缩容机制。适用于设计鲁棒的MLOps流程、规划高性能多模型推理服务,或建立标准的GPU云部署规范。
查看详情
CoreWeave GPU工作负载模式
coreweave-sdk-patterns
jeremylongshore/claude-code-plugins-plus-skills
395
该SDK提供了一系列生产级的Python模式,用于在CoreWeave平台上管理GPU计算任务。它帮助用户定义GPU资源规格、设置节点亲和性,并生成完整的Kubernetes部署模板。适用于构建稳定可靠的AI推理客户端、管理GPU基础设施或自动化复杂的AI工作流。
查看详情
YOLO模型微调与部署
model-training
SharpAI/DeepCamera
347
该技能提供了一个完整的计算机视觉模型生命周期管理工具,支持从自定义数据集标注到模型部署的全流程。用户可以在该平台上使用Agent驱动的工作流,在自定义的COCO格式数据集上微调YOLO模型。它具备硬件感知训练能力,并能自动将模型导出为TensorRT、CoreML、OpenVINO等优化格式,最后可一键部署为活动的检测技能。
查看详情
Together AI生产部署清单
together-prod-checklist
jeremylongshore/claude-code-plugins-plus-skills
373
本清单是一份完整的M/Ops指南,用于指导使用Together AI API构建AI应用的生产环境部署。它涵盖了生产环境的关键环节,包括安全密钥管理、API限流处理、错误容错机制(如断路器和重试)、以及全面的监控和成本控制,确保大型语言模型(LLM)服务的稳定性和可靠性。
查看详情
Together AI Webhook事件处理器
together-webhooks-events
jeremylongshore/claude-code-plugins-plus-skills
215
本工具用于处理来自Together AI的异步Webhook事件。它允许开发者构建健壮的、事件驱动的机器学习(ML)工作流。通过订阅这些Webhook(例如微调完成、批处理结果、模型弃用),可以避免频繁轮询API状态,从而实现高效的自动化ML部署和监控。
查看详情
上一页
1
2
3
4
语言
简体中文
English