登录
下载
Skill UI
浏览并发现
9126+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
用户问题
,共找到
14
条记录
默认排序
最新上传
最多下载
错误追踪与可观测性专家
error-diagnostics-error-trace
sickn33/antigravity-awesome-skills
304
本技能是全面的错误监控和可观测性专家,指导用户搭建和优化生产环境的错误追踪系统。它涵盖了配置实时告警、实现结构化日志、错误分组、故障诊断和自动恢复策略,旨在显著提升系统的稳定性和问题解决效率。
查看详情
Linear事件应急处理手册
linear-incident-runbook
jeremylongshore/claude-code-plugins-plus-skills
215
本手册提供了一套完整的Linear生产环境事件处理流程。它指导用户按步骤诊断和解决包括API认证失败、速率限制、Webhook故障和平台停机等各类突发问题,确保系统能够快速、有效地恢复运行。
查看详情
K8s深度故障排查指南
debug-buttercup
sickn33/antigravity-awesome-skills
159
本指南提供了一套全面的、针对Kubernetes环境的故障排查流程。它覆盖了从Pod状态异常(如CrashLoopBackOff)、服务级联故障、资源压力检测,到Redis核心组件的深入诊断,帮助用户系统性地定位和解决复杂的系统级问题。
查看详情
运营监控仪表盘构建
dashboard-builder
affaan-m/everything-claude-code
495
本技能旨在指导用户构建具备高可用性的运营监控仪表盘,适用于Grafana、SigNoz等可观测性平台。核心目标是将海量原始指标转化为可操作的洞察,回答关键的运维问题(如:系统是否健康?瓶颈在哪里?需要采取什么行动?),而非单纯地罗列数据指标。特别适用于构建Kafka、Elasticsearch或API网关的性能监控面板。
查看详情
Arch Linux系统故障排查
arch-linux-triage
github/awesome-copilot
201
这是一个专业的Arch Linux系统诊断和修复助手。它能充当Arch Linux专家,利用pacman、systemd、journalctl等核心工具,为用户提供结构化的故障排除流程。它提供循序渐进的修复步骤、可直接执行的命令,帮助用户解决复杂的发行版升级和系统稳定性问题。
查看详情
Qdrant性能故障诊断指南
qdrant-monitoring-debugging
github/awesome-copilot
312
本指南旨在提供系统化的Qdrant生产环境性能诊断流程。它详细指导用户如何排查三大核心问题:优化器卡死、内存占用过高(OOM)以及查询延迟慢。通过检查关键指标和API端点,帮助运维和开发人员快速定位性能瓶颈,确保系统稳定运行。
查看详情
Figma API故障排查手册
figma-incident-runbook
jeremylongshore/claude-code-plugins-plus-skills
76
本手册提供了一套完整的Figma API故障应急响应流程。它指导用户如何进行快速故障排查,包括检查API状态、认证令牌和限速问题。内容涵盖了基于不同错误代码(如403、429、500)的决策树,以及应用即时缓解措施(如令牌轮换、数据缓存回退)和撰写完整的故障复盘报告,确保系统稳定运行。
查看详情
Fly.io 常见错误排查指南
flyio-common-errors
jeremylongshore/claude-code-plugins-plus-skills
330
本指南是用于诊断和解决 Fly.io 平台常见运行时和部署错误的快速参考手册。内容涵盖了健康检查失败、镜像构建失败、机器启动问题、连接拒绝等问题,提供了具体的诊断命令和配置修复方案,帮助用户快速定位并解决部署和运行中的故障。
查看详情
Canva API故障应急处理手册
canva-incident-runbook
jeremylongshore/claude-code-plugins-plus-skills
313
本手册是一份结构化的故障应急响应指南,专门用于处理与Canva Connect API相关的集成故障。它指导用户进行初步问题排查、处理401/429/5xx等常见错误,并涵盖了内部和外部的沟通模板、故障证据收集和详细的事故回顾(Postmortem)流程,确保快速恢复服务。
查看详情
CoreWeave故障排查手册
coreweave-incident-runbook
jeremylongshore/claude-code-plugins-plus-skills
430
这是一份用于CoreWeave平台的关键生产环境故障排除手册。它提供了应对GPU工作负载故障、推理服务宕机或Kubernetes资源问题的结构化步骤,指导用户检查Pod状态、节点健康和模型加载错误,以实现快速恢复服务。
查看详情
Datadog日志分析与事故排查
datadog
nexu-io/nexu
204
本指南提供了在Nexu平台使用Datadog日志API进行生产环境故障排查的完整流程。它指导用户如何查询崩溃事件、分析OpenClaw的标准错误输出、检查网关启动状态以及审查API请求日志。内容包括认证要求、按Pod和时间范围过滤的最佳实践,并提供了使用Python解析原始日志的步骤,帮助用户快速定位生产问题。
查看详情
Fly.io 调试诊断工具包
flyio-debug-bundle
jeremylongshore/claude-code-plugins-plus-skills
342
这是一个用于收集Fly.io应用全套诊断证据的工具包。它能捕获机器状态、应用日志、卷信息、网络诊断等关键数据,为用户提供完整的故障排除资料,用于解决部署卡顿、机器故障或网络连接问题。
查看详情
1
2
下一页
语言
简体中文
English