登录
下载
Skill UI
浏览并发现
9183+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
排查
,共找到
20
条记录
默认排序
最新上传
最多下载
专业DevOps故障排除指南
devops-troubleshooter
sickn33/antigravity-awesome-skills
458
本指南是深入的DevOps运维故障排除资源,涵盖了现代可观测性实践(如日志、指标、追踪)、Kubernetes和容器故障排查、复杂网络诊断、CI/CD流程优化以及多云平台问题解决。适用于进行系统根因分析、提升系统可靠性,解决复杂的跨领域运维问题。
查看详情
Documenso故障排查手册
documenso-incident-runbook
jeremylongshore/claude-code-plugins-plus-skills
428
本手册是Documenso深度集成的故障响应指南。它为运营和开发人员提供了应对生产环境中断、云服务中断、自托管数据库问题和Webhook失败的详细步骤和诊断命令,旨在帮助工程师快速定位问题根源并恢复服务。
查看详情
Fireflies.ai 故障排查手册
fireflies-incident-runbook
jeremylongshore/claude-code-plugins-plus-skills
259
本技能手册提供了一套全面的 Fireflies.ai 集成故障排查流程。它指导工程师进行系统化的故障诊断,涵盖了 API 连接问题、认证失败、速率限制和 Webhook 错误等常见问题,并提供了从 P1 到 P4 的分级响应和修复步骤,帮助团队快速恢复服务。
查看详情
Groq API故障应急手册
groq-incident-runbook
jeremylongshore/claude-code-plugins-plus-skills
316
本手册是针对Groq API故障的完整应急响应流程。它指导用户进行故障分级(P1-P4)和初步排查(检查状态、认证、速率限制)。内容包括错误决策树和实时的缓解措施,如启用备用模型或处理API密钥过期,确保在第三方服务中断时也能维持业务连续性。
查看详情
Ideogram API故障应急手册
ideogram-incident-runbook
jeremylongshore/claude-code-plugins-plus-skills
252
这是一份全面的应急响应手册,用于处理Ideogram API的各种故障场景,包括连接失败、认证错误或性能降级。手册提供了从初步故障排查、状态码判断到启用降级模式(Fallback)的完整流程,帮助团队快速定位根因并恢复服务。
查看详情
Sentry事故响应手册
sentry-incident-runbook
jeremylongshore/claude-code-plugins-plus-skills
442
基于Sentry的结构化事故响应流程。该手册指导用户从识别、分类(P0-P3)到深入调查,涵盖了使用堆栈跟踪、用户行为轨迹(breadcrumbs)以及API查询来确定根源、评估影响并撰写事故报告。适用于生产环境的故障排查和运维场景。
查看详情
K8s深度故障排查指南
debug-buttercup
sickn33/antigravity-awesome-skills
159
本指南提供了一套全面的、针对Kubernetes环境的故障排查流程。它覆盖了从Pod状态异常(如CrashLoopBackOff)、服务级联故障、资源压力检测,到Redis核心组件的深入诊断,帮助用户系统性地定位和解决复杂的系统级问题。
查看详情
Arch Linux系统故障排查
arch-linux-triage
github/awesome-copilot
201
这是一个专业的Arch Linux系统诊断和修复助手。它能充当Arch Linux专家,利用pacman、systemd、journalctl等核心工具,为用户提供结构化的故障排除流程。它提供循序渐进的修复步骤、可直接执行的命令,帮助用户解决复杂的发行版升级和系统稳定性问题。
查看详情
KubeSphere日志采集与可观测性
whizard-logging
kubesphere/kubesphere
467
WizTelemetry Logging是KubeSphere可观测性平台的核心组件,专用于实现日志的采集、处理和存储。它支持从容器的标准输出/错误流以及容器内部的本地磁盘文件收集日志。通过与OpenSearch的集成,该组件提供强大的日志查询能力,是保障Kubernetes集群系统可见性和进行故障排查的关键工具。
查看详情
Qdrant性能故障诊断指南
qdrant-monitoring-debugging
github/awesome-copilot
312
本指南旨在提供系统化的Qdrant生产环境性能诊断流程。它详细指导用户如何排查三大核心问题:优化器卡死、内存占用过高(OOM)以及查询延迟慢。通过检查关键指标和API端点,帮助运维和开发人员快速定位性能瓶颈,确保系统稳定运行。
查看详情
Figma API故障排查手册
figma-incident-runbook
jeremylongshore/claude-code-plugins-plus-skills
76
本手册提供了一套完整的Figma API故障应急响应流程。它指导用户如何进行快速故障排查,包括检查API状态、认证令牌和限速问题。内容涵盖了基于不同错误代码(如403、429、500)的决策树,以及应用即时缓解措施(如令牌轮换、数据缓存回退)和撰写完整的故障复盘报告,确保系统稳定运行。
查看详情
Fly.io 常见错误排查指南
flyio-common-errors
jeremylongshore/claude-code-plugins-plus-skills
330
本指南是用于诊断和解决 Fly.io 平台常见运行时和部署错误的快速参考手册。内容涵盖了健康检查失败、镜像构建失败、机器启动问题、连接拒绝等问题,提供了具体的诊断命令和配置修复方案,帮助用户快速定位并解决部署和运行中的故障。
查看详情
1
2
下一页
语言
简体中文
English