登录
下载
Skill UI
浏览并发现
10582+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
AI 运维
,共找到
46
条记录
默认排序
最新上传
最多下载
Freshservice 工单自动化
freshservice-automation
sickn33/antigravity-awesome-skills
171
通过 Rube MCP 的 Composio Freshservice 工具包自动化处理 ITSM 工单搜索、创建、批量更新、服务目录请求与外发邮件,提升运维效率。
查看详情
KubeSphere扩展组件管理
kubesphere-extension-management
kubesphere/kubesphere
154
本技能详细指导用户掌握KubeSphere扩展组件的完整生命周期管理。涵盖了扩展的发现、版本校验、依赖管理,并通过InstallPlan机制执行精确的安装、升级或卸载操作。适用于复杂的Kubernetes集群组件运维。
查看详情
Qdrant性能故障诊断指南
qdrant-monitoring-debugging
github/awesome-copilot
312
本指南旨在提供系统化的Qdrant生产环境性能诊断流程。它详细指导用户如何排查三大核心问题:优化器卡死、内存占用过高(OOM)以及查询延迟慢。通过检查关键指标和API端点,帮助运维和开发人员快速定位性能瓶颈,确保系统稳定运行。
查看详情
Aurora DSQL 数据库管理指南
dsql
awslabs/mcp
397
本技能是亚马逊 Aurora DSQL 的全面开发和运维指南。它专注于无服务器、分布式 SQL 数据库的完整生命周期管理,涵盖模式构建、直接查询执行、复杂的跨数据库迁移(如 MySQL 到 DSQL)以及通过查询计划分析实现性能调优。是构建安全、高可用多租户应用的关键工具。
查看详情
CAST AI 基础设施错误排查指南
castai-common-errors
jeremylongshore/claude-code-plugins-plus-skills
90
本指南是用于诊断 CAST AI 系统常见故障的综合手册。内容涵盖了从Agent连接失败、API认证错误到Kubernetes集群扩缩容、资源配额限制等多个维度的故障排除场景,提供了详细的诊断命令(如kubectl, curl, helm)和修复步骤,适用于专业的运维和故障排查工作。
查看详情
Algolia故障响应手册
algolia-incident-runbook
jeremylongshore/claude-code-plugins-plus-skills
252
本手册是处理Algolia搜索功能故障的快速响应指南。它提供结构化的故障分级和诊断流程,帮助运维工程师区分是基础设施故障还是配置错误(如API Key或索引丢失)。内容涵盖故障排查步骤、关键修复代码和通信模板,确保系统能够快速恢复正常运行。
查看详情
Claude API生产部署检查清单
anth-prod-checklist
jeremylongshore/claude-code-plugins-plus-skills
415
本清单是部署基于Claude API的AI功能到生产环境的完整指南。它涵盖了从认证、错误处理、成本控制到可观测性(日志、指标、健康检查)等各个关键环节,旨在确保AI功能在上线时具备高可靠性和最佳的运维实践。
查看详情
ClickHouse可观测性监控配置
clickhouse-observability
jeremylongshore/claude-code-plugins-plus-skills
340
本指南提供了完整的ClickHouse可观测性监控解决方案。内容涵盖了如何利用系统表查询获取核心指标,如何将这些指标集成到Prometheus进行数据采集,并最终在Grafana上构建仪表盘。它用于监控生产环境的查询性能、数据合并健康度、资源使用和错误率,帮助运维人员进行系统调优和告警配置。
查看详情
Cohere API故障应急手册
cohere-incident-runbook
jeremylongshore/claude-code-plugins-plus-skills
186
这是一份全面的应急响应手册,用于处理Cohere API的各种故障。它指导用户进行故障分级(P1-P4)和快速排查,涵盖了API密钥验证、速率限制处理、服务器错误处理等详细缓解措施。帮助运维人员快速定位问题根源,并实现服务优雅降级。
查看详情
Aurora DSQL:分布式数据库开发与运维
distributed-sql
awslabs/mcp
129
本技能提供了一套完整的指导,用于使用Amazon Aurora DSQL(一个无服务器、分布式、PostgreSQL兼容的SQL数据库)构建和管理应用。内容涵盖了从基础的Schema设计、多租户隔离、IAM权限设置,到复杂的DDL迁移(如列和约束修改),以及MySQL到DSQL的数据类型映射和查询性能优化等全流程技术细节,确保数据架构的稳健与可扩展性。
查看详情
Flexport事件应急手册
flexport-incident-runbook
jeremylongshore/claude-code-plugins-plus-skills
107
本手册是针对Flexport API集成故障的综合应急指南。它详细覆盖了API中断、Webhook丢失和供应链数据同步失败等各种突发事件。内容包括了严重程度分级、诊断步骤和详细的故障排查流程,旨在帮助运维人员快速定位问题并执行有效缓解措施。
查看详情
Glean搜索故障应急手册
glean-incident-runbook
jeremylongshore/claude-code-plugins-plus-skills
52
本手册是Glean企业搜索平台的专业故障应急响应指南。它系统化地覆盖了从P1级到P4级的各类故障情景,包括API中断、数据同步失败、索引积压和权限漂移等。内容提供了详细的诊断步骤、故障排除流程和沟通模板,旨在帮助技术运维和支持团队快速定位并解决搜索系统问题。
查看详情
上一页
1
2
3
4
下一页
语言
简体中文
English