下载

Skill UI

浏览并发现 9765+ 精选技能

全部编程开发人工智能设计创意产品商业数据科学市场营销职场通用效率工具硬件工程语言学习

搜索模型服务，共找到 35 条记录

默认排序最新上传最多下载

上下文预算与LLM优化

affaan-m/everything-claude-code

本工具用于审计Claude Code会话中所有组件（如代理、技能、规则和MCP服务器）的Token消耗。它能分析上下文开销，识别冗余或臃肿的组件，并生成详细的上下文预算报告。帮助用户管理Token使用量，确保模型运行效率和性能。

无服务器GPU云平台：AI训练与推理

serverless-modal

wanshuiyin/Auto-claude-code-research-in-sleep

这是一个零配置的无服务器GPU云平台，专为运行复杂的机器学习工作负载而设计，包括模型训练、微调和实时推理。它无需复杂的环境设置（无需SSH或Docker），支持本地优先和自动弹性伸缩，适用于所有高性能GPU。非常适合需要可扩展、高效率远程计算资源的AI工程师和数据科学家。

C# 模型上下文服务器构建

csharp-mcp-server-generator

github/awesome-copilot

本技能旨在指导使用C#和.NET构建一个完整的、生产级别的模型上下文协议（MCP）服务器。内容涵盖了先进架构模式，如Host构建、依赖注入、结构化日志配置以及实现功能强大的工具。适用于构建需要标准化通信和工具调用能力的AI代理或复杂后端服务。

无服务器AI/ML云平台

K-Dense-AI/scientific-agent-skills

Modal是一个无服务器云平台，专为AI/ML工作负载设计，允许用户直接用Python代码运行复杂的计算任务。它提供按需的GPU算力、自动扩缩容的函数调用、自定义容器构建和持久化存储。适用于模型部署、训练推理、构建高性能API和定时任务。

AI安全扫描与漏洞检测

Tencent/AI-Infra-Guard

本工具依托红心实验室的AI-Infra-Guard框架，提供全方位的AI安全扫描服务。可对AI基础设施、工具、技能、Agent以及大型语言模型进行深度安全审计和漏洞检测，包括越狱测试，确保AI系统的安全性和可靠性。

CoreWeave KServe GPU推理服务部署

coreweave-core-workflow-a

jeremylongshore/claude-code-plugins-plus-skills

本指南详细介绍了如何在CoreWeave上使用KServe部署生产级机器学习推理服务。内容涵盖了配置GPU调度、实现自动扩缩容以及设置冷启动优化的流程。适用于需要部署大型语言模型（LLMs）或其他复杂AI模型的MLOps工程师。

CoreWeave GPU云参考架构

coreweave-reference-architecture

jeremylongshore/claude-code-plugins-plus-skills

本参考架构提供了一套在CoreWeave GPU云上部署机器学习模型的完整蓝图。它详细描述了多模型服务（如vLLM, TGI）的Kubernetes部署结构、共享持久化存储（PVC）以及基于KServe/Knative的自动扩缩容机制。适用于设计鲁棒的MLOps流程、规划高性能多模型推理服务，或建立标准的GPU云部署规范。

ElevenLabs 调试信息收集

elevenlabs-debug-bundle

jeremylongshore/claude-code-plugins-plus-skills

本工具用于收集 ElevenLabs 服务的全套诊断信息，旨在为技术支持提供完整的证据链。它会自动获取 SDK 版本、API 连接状态、配额使用情况、可用音色和模型信息。当遇到持续性问题或需要提交专业技术支持工单时，使用此功能进行故障排查。

Together AI模型部署集成服务

together-deploy-integration

jeremylongshore/claude-code-plugins-plus-skills

本技能提供了一套生产级容器化集成服务，用于连接Together AI平台。它支持通过Together的OpenAI兼容API，实现对100多个开源模型的推理、微调和部署。集成了完善的Docker配置、健康检查和无停机滚动更新机制，确保了高性能和高可靠性的实时大模型服务。

Together AI生产部署清单

together-prod-checklist

jeremylongshore/claude-code-plugins-plus-skills

本清单是一份完整的M/Ops指南，用于指导使用Together AI API构建AI应用的生产环境部署。它涵盖了生产环境的关键环节，包括安全密钥管理、API限流处理、错误容错机制（如断路器和重试）、以及全面的监控和成本控制，确保大型语言模型（LLM）服务的稳定性和可靠性。

生产级AI模型部署架构

together-reference-architecture

jeremylongshore/claude-code-plugins-plus-skills

这是一套用于构建可扩展、高可用、成本高效的AI服务层的参考架构。它涵盖了完整的AI生命周期管理，包括智能模型路由（实现成本与性能的权衡）、响应缓存、异步批量处理和模型微调管线管理。适用于需要跨多个开源模型提供高可用性的企业级应用。

语言