下载

Skill UI

浏览并发现 9747+ 精选技能

全部编程开发人工智能设计创意产品商业数据科学市场营销职场通用效率工具硬件工程语言学习

搜索 ML部署，共找到 46 条记录

默认排序最新上传最多下载

Transformers.js JavaScript 机器学习

transformers-js

sickn33/antigravity-awesome-skills

在浏览器或 Node.js 中通过 Transformers.js 运行 Hugging Face 模型，涵盖文本、图像与语音任务，提供 Pipeline 抽象、设备选择与量化选项，可在客户端部署多模态推理，无需后端。

无服务器AI/ML云平台

K-Dense-AI/scientific-agent-skills

Modal是一个无服务器云平台，专为AI/ML工作负载设计，允许用户直接用Python代码运行复杂的计算任务。它提供按需的GPU算力、自动扩缩容的函数调用、自定义容器构建和持久化存储。适用于模型部署、训练推理、构建高性能API和定时任务。

CoreWeave KServe GPU推理服务部署

coreweave-core-workflow-a

jeremylongshore/claude-code-plugins-plus-skills

本指南详细介绍了如何在CoreWeave上使用KServe部署生产级机器学习推理服务。内容涵盖了配置GPU调度、实现自动扩缩容以及设置冷启动优化的流程。适用于需要部署大型语言模型（LLMs）或其他复杂AI模型的MLOps工程师。

CoreWeave K8s环境设置与认证

coreweave-install-auth

jeremylongshore/claude-code-plugins-plus-skills

本指南提供了一套完整的CoreWeave Kubernetes服务（CKS）配置流程。内容包括如何下载kubeconfig文件、设置API令牌以及使用`kubectl`命令验证GPU资源访问。适用于所有需要在裸金属GPU集群上部署AI/ML工作负载的用户。

云端机器学习工作负载迁移指南

coreweave-migration-deep-dive

jeremylongshore/claude-code-plugins-plus-skills

本技能包详细指导用户如何将机器学习工作负载（包括推理服务和训练管道）从AWS/GCP/Azure等大型云平台迁移到CoreWeave GPU云。内容涵盖成本对比、容器化步骤、Kubernetes配置适配和分阶段部署，帮助用户确保迁移过程平稳、高效且具成本效益。

CoreWeave GPU云参考架构

coreweave-reference-architecture

jeremylongshore/claude-code-plugins-plus-skills

本参考架构提供了一套在CoreWeave GPU云上部署机器学习模型的完整蓝图。它详细描述了多模型服务（如vLLM, TGI）的Kubernetes部署结构、共享持久化存储（PVC）以及基于KServe/Knative的自动扩缩容机制。适用于设计鲁棒的MLOps流程、规划高性能多模型推理服务，或建立标准的GPU云部署规范。

CoreWeave GPU工作负载模式

coreweave-sdk-patterns

jeremylongshore/claude-code-plugins-plus-skills

该SDK提供了一系列生产级的Python模式，用于在CoreWeave平台上管理GPU计算任务。它帮助用户定义GPU资源规格、设置节点亲和性，并生成完整的Kubernetes部署模板。适用于构建稳定可靠的AI推理客户端、管理GPU基础设施或自动化复杂的AI工作流。

YOLO模型微调与部署

SharpAI/DeepCamera

该技能提供了一个完整的计算机视觉模型生命周期管理工具，支持从自定义数据集标注到模型部署的全流程。用户可以在该平台上使用Agent驱动的工作流，在自定义的COCO格式数据集上微调YOLO模型。它具备硬件感知训练能力，并能自动将模型导出为TensorRT、CoreML、OpenVINO等优化格式，最后可一键部署为活动的检测技能。

Together AI生产部署清单

together-prod-checklist

jeremylongshore/claude-code-plugins-plus-skills

本清单是一份完整的M/Ops指南，用于指导使用Together AI API构建AI应用的生产环境部署。它涵盖了生产环境的关键环节，包括安全密钥管理、API限流处理、错误容错机制（如断路器和重试）、以及全面的监控和成本控制，确保大型语言模型（LLM）服务的稳定性和可靠性。

Together AI Webhook事件处理器

together-webhooks-events

jeremylongshore/claude-code-plugins-plus-skills

本工具用于处理来自Together AI的异步Webhook事件。它允许开发者构建健壮的、事件驱动的机器学习（ML）工作流。通过订阅这些Webhook（例如微调完成、批处理结果、模型弃用），可以避免频繁轮询API状态，从而实现高效的自动化ML部署和监控。

上一页 1 2 34

语言