登录
下载
Skill UI
浏览并发现
9185+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
错误恢复
,共找到
7
条记录
默认排序
最新上传
最多下载
错误追踪与可观测性专家
error-diagnostics-error-trace
sickn33/antigravity-awesome-skills
304
本技能是全面的错误监控和可观测性专家,指导用户搭建和优化生产环境的错误追踪系统。它涵盖了配置实时告警、实现结构化日志、错误分组、故障诊断和自动恢复策略,旨在显著提升系统的稳定性和问题解决效率。
查看详情
Fireflies.ai 故障排查手册
fireflies-incident-runbook
jeremylongshore/claude-code-plugins-plus-skills
259
本技能手册提供了一套全面的 Fireflies.ai 集成故障排查流程。它指导工程师进行系统化的故障诊断,涵盖了 API 连接问题、认证失败、速率限制和 Webhook 错误等常见问题,并提供了从 P1 到 P4 的分级响应和修复步骤,帮助团队快速恢复服务。
查看详情
Ideogram API故障应急手册
ideogram-incident-runbook
jeremylongshore/claude-code-plugins-plus-skills
252
这是一份全面的应急响应手册,用于处理Ideogram API的各种故障场景,包括连接失败、认证错误或性能降级。手册提供了从初步故障排查、状态码判断到启用降级模式(Fallback)的完整流程,帮助团队快速定位根因并恢复服务。
查看详情
Canva API故障应急处理手册
canva-incident-runbook
jeremylongshore/claude-code-plugins-plus-skills
313
本手册是一份结构化的故障应急响应指南,专门用于处理与Canva Connect API相关的集成故障。它指导用户进行初步问题排查、处理401/429/5xx等常见错误,并涵盖了内部和外部的沟通模板、故障证据收集和详细的事故回顾(Postmortem)流程,确保快速恢复服务。
查看详情
CoreWeave故障排查手册
coreweave-incident-runbook
jeremylongshore/claude-code-plugins-plus-skills
430
这是一份用于CoreWeave平台的关键生产环境故障排除手册。它提供了应对GPU工作负载故障、推理服务宕机或Kubernetes资源问题的结构化步骤,指导用户检查Pod状态、节点健康和模型加载错误,以实现快速恢复服务。
查看详情
Fathom生产环境就绪检查清单
fathom-prod-checklist
jeremylongshore/claude-code-plugins-plus-skills
467
这是一份全面的技术检查清单,用于指导开发人员确保Fathom API集成在投入生产环境使用前达到最高标准。它涵盖了从密钥管理、限速处理、Webhook验证到错误恢复机制(如断路器)和数据隐私(PII)合规性等关键环节,确保会议数据管道的稳定、安全和可靠。
查看详情
Foundry故障应急手册
palantir-incident-runbook
jeremylongshore/claude-code-plugins-plus-skills
144
本手册提供Palantir Foundry系统故障和突发事件的完整应急响应流程。它涵盖了从初步故障分级(P1-P4)到认证失败、限速和构建流程错误的详细处理步骤。通过遵循手册,用户可以系统化地进行故障调查、执行恢复措施,并撰写完整的事后总结报告,确保快速止损和系统恢复。
查看详情
1
语言
简体中文
English