登录
下载
Skill UI
浏览并发现
9183+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
运维
,共找到
11
条记录
默认排序
最新上传
最多下载
专业DevOps故障排除指南
devops-troubleshooter
sickn33/antigravity-awesome-skills
458
本指南是深入的DevOps运维故障排除资源,涵盖了现代可观测性实践(如日志、指标、追踪)、Kubernetes和容器故障排查、复杂网络诊断、CI/CD流程优化以及多云平台问题解决。适用于进行系统根因分析、提升系统可靠性,解决复杂的跨领域运维问题。
查看详情
GitHub AI工作流自动化
github-workflow-automation
sickn33/antigravity-awesome-skills
261
本技能提供了一套基于AI的GitHub工作流自动化模式,旨在提升软件开发运维(DevOps)流程效率。它支持利用AI进行自动PR代码审查、根据Issue内容自动分配标签和撰写评论,并能在CI/CD流程中集成高级AI能力,极大优化了代码质量和项目管理。
查看详情
Sentry事故响应手册
sentry-incident-runbook
jeremylongshore/claude-code-plugins-plus-skills
442
基于Sentry的结构化事故响应流程。该手册指导用户从识别、分类(P0-P3)到深入调查,涵盖了使用堆栈跟踪、用户行为轨迹(breadcrumbs)以及API查询来确定根源、评估影响并撰写事故报告。适用于生产环境的故障排查和运维场景。
查看详情
OT环境远程访问安全
securing-remote-access-to-ot-environment
mukul975/Anthropic-Cybersecurity-Skills
466
提供OT/ICS远程访问安全指南,涵盖DMZ跳板机架构、多因素认证、供应商权限控制、会话录制及IEC 62443/NERC CIP-005-7合规,帮助运维团队替换不安全的VPN直连。
查看详情
运营监控仪表盘构建
dashboard-builder
affaan-m/everything-claude-code
495
本技能旨在指导用户构建具备高可用性的运营监控仪表盘,适用于Grafana、SigNoz等可观测性平台。核心目标是将海量原始指标转化为可操作的洞察,回答关键的运维问题(如:系统是否健康?瓶颈在哪里?需要采取什么行动?),而非单纯地罗列数据指标。特别适用于构建Kafka、Elasticsearch或API网关的性能监控面板。
查看详情
KubeSphere核心:云原生平台管理
kubesphere-core
kubesphere/kubesphere
359
KubeSphere核心组件,作为基于Kubernetes的云原生应用管理操作系统。它提供统一的API聚合层,支持多集群和多租户管理。负责管理核心资源和复杂的API路由,极大简化了云原生应用的部署和运维操作。
查看详情
Qdrant性能故障诊断指南
qdrant-monitoring-debugging
github/awesome-copilot
312
本指南旨在提供系统化的Qdrant生产环境性能诊断流程。它详细指导用户如何排查三大核心问题:优化器卡死、内存占用过高(OOM)以及查询延迟慢。通过检查关键指标和API端点,帮助运维和开发人员快速定位性能瓶颈,确保系统稳定运行。
查看详情
ClickHouse可观测性监控配置
clickhouse-observability
jeremylongshore/claude-code-plugins-plus-skills
340
本指南提供了完整的ClickHouse可观测性监控解决方案。内容涵盖了如何利用系统表查询获取核心指标,如何将这些指标集成到Prometheus进行数据采集,并最终在Grafana上构建仪表盘。它用于监控生产环境的查询性能、数据合并健康度、资源使用和错误率,帮助运维人员进行系统调优和告警配置。
查看详情
Flexport事件应急手册
flexport-incident-runbook
jeremylongshore/claude-code-plugins-plus-skills
107
本手册是针对Flexport API集成故障的综合应急指南。它详细覆盖了API中断、Webhook丢失和供应链数据同步失败等各种突发事件。内容包括了严重程度分级、诊断步骤和详细的故障排查流程,旨在帮助运维人员快速定位问题并执行有效缓解措施。
查看详情
Glean搜索故障应急手册
glean-incident-runbook
jeremylongshore/claude-code-plugins-plus-skills
52
本手册是Glean企业搜索平台的专业故障应急响应指南。它系统化地覆盖了从P1级到P4级的各类故障情景,包括API中断、数据同步失败、索引积压和权限漂移等。内容提供了详细的诊断步骤、故障排除流程和沟通模板,旨在帮助技术运维和支持团队快速定位并解决搜索系统问题。
查看详情
Salesforce故障应急处理手册
salesforce-incident-runbook
jeremylongshore/claude-code-plugins-plus-skills
322
本手册是针对Salesforce集成故障和系统中断的综合运维指南。它提供了从初步故障排除、诊断常见API错误(如限速、认证失败)、实施缓解措施到进行详细事后分析(Postmortem)的完整流程。旨在帮助用户快速、系统性地解决生产环境中的关键系统稳定性问题。
查看详情
1
语言
简体中文
English