登录
下载
Skill UI
浏览并发现
9765+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
模型服务
,共找到
35
条记录
默认排序
最新上传
最多下载
上下文预算与LLM优化
context-budget
affaan-m/everything-claude-code
85
本工具用于审计Claude Code会话中所有组件(如代理、技能、规则和MCP服务器)的Token消耗。它能分析上下文开销,识别冗余或臃肿的组件,并生成详细的上下文预算报告。帮助用户管理Token使用量,确保模型运行效率和性能。
查看详情
无服务器GPU云平台:AI训练与推理
serverless-modal
wanshuiyin/Auto-claude-code-research-in-sleep
281
这是一个零配置的无服务器GPU云平台,专为运行复杂的机器学习工作负载而设计,包括模型训练、微调和实时推理。它无需复杂的环境设置(无需SSH或Docker),支持本地优先和自动弹性伸缩,适用于所有高性能GPU。非常适合需要可扩展、高效率远程计算资源的AI工程师和数据科学家。
查看详情
C# 模型上下文服务器构建
csharp-mcp-server-generator
github/awesome-copilot
493
本技能旨在指导使用C#和.NET构建一个完整的、生产级别的模型上下文协议(MCP)服务器。内容涵盖了先进架构模式,如Host构建、依赖注入、结构化日志配置以及实现功能强大的工具。适用于构建需要标准化通信和工具调用能力的AI代理或复杂后端服务。
查看详情
无服务器AI/ML云平台
modal
K-Dense-AI/scientific-agent-skills
139
Modal是一个无服务器云平台,专为AI/ML工作负载设计,允许用户直接用Python代码运行复杂的计算任务。它提供按需的GPU算力、自动扩缩容的函数调用、自定义容器构建和持久化存储。适用于模型部署、训练推理、构建高性能API和定时任务。
查看详情
AI安全扫描与漏洞检测
aig-scanner
Tencent/AI-Infra-Guard
240
本工具依托红心实验室的AI-Infra-Guard框架,提供全方位的AI安全扫描服务。可对AI基础设施、工具、技能、Agent以及大型语言模型进行深度安全审计和漏洞检测,包括越狱测试,确保AI系统的安全性和可靠性。
查看详情
CoreWeave KServe GPU推理服务部署
coreweave-core-workflow-a
jeremylongshore/claude-code-plugins-plus-skills
155
本指南详细介绍了如何在CoreWeave上使用KServe部署生产级机器学习推理服务。内容涵盖了配置GPU调度、实现自动扩缩容以及设置冷启动优化的流程。适用于需要部署大型语言模型(LLMs)或其他复杂AI模型的MLOps工程师。
查看详情
CoreWeave GPU云参考架构
coreweave-reference-architecture
jeremylongshore/claude-code-plugins-plus-skills
347
本参考架构提供了一套在CoreWeave GPU云上部署机器学习模型的完整蓝图。它详细描述了多模型服务(如vLLM, TGI)的Kubernetes部署结构、共享持久化存储(PVC)以及基于KServe/Knative的自动扩缩容机制。适用于设计鲁棒的MLOps流程、规划高性能多模型推理服务,或建立标准的GPU云部署规范。
查看详情
ElevenLabs 调试信息收集
elevenlabs-debug-bundle
jeremylongshore/claude-code-plugins-plus-skills
357
本工具用于收集 ElevenLabs 服务的全套诊断信息,旨在为技术支持提供完整的证据链。它会自动获取 SDK 版本、API 连接状态、配额使用情况、可用音色和模型信息。当遇到持续性问题或需要提交专业技术支持工单时,使用此功能进行故障排查。
查看详情
Together AI模型部署集成服务
together-deploy-integration
jeremylongshore/claude-code-plugins-plus-skills
87
本技能提供了一套生产级容器化集成服务,用于连接Together AI平台。它支持通过Together的OpenAI兼容API,实现对100多个开源模型的推理、微调和部署。集成了完善的Docker配置、健康检查和无停机滚动更新机制,确保了高性能和高可靠性的实时大模型服务。
查看详情
Together AI生产部署清单
together-prod-checklist
jeremylongshore/claude-code-plugins-plus-skills
373
本清单是一份完整的M/Ops指南,用于指导使用Together AI API构建AI应用的生产环境部署。它涵盖了生产环境的关键环节,包括安全密钥管理、API限流处理、错误容错机制(如断路器和重试)、以及全面的监控和成本控制,确保大型语言模型(LLM)服务的稳定性和可靠性。
查看详情
生产级AI模型部署架构
together-reference-architecture
jeremylongshore/claude-code-plugins-plus-skills
333
这是一套用于构建可扩展、高可用、成本高效的AI服务层的参考架构。它涵盖了完整的AI生命周期管理,包括智能模型路由(实现成本与性能的权衡)、响应缓存、异步批量处理和模型微调管线管理。适用于需要跨多个开源模型提供高可用性的企业级应用。
查看详情
上一页
1
2
3
语言
简体中文
English