登录
下载
Skill UI
浏览并发现
9785+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
服务中断
,共找到
19
条记录
默认排序
最新上传
最多下载
Apollo API 迁移与升级助手
apollo-upgrade-migration
jeremylongshore/claude-code-plugins-plus-skills
266
本工具旨在帮助开发者安全地管理和自动化 Apollo.io API 的升级和迁移。它提供完整的流程,包括审计现有 API 调用,识别过时和弃用掉的接口与认证方式。通过生成迁移规则和运行影子测试(Shadow Test),确保在进行重大系统升级时,API 调用能够实现平稳过渡,避免服务中断。
查看详情
CodeRabbit 故障应急处理流程
coderabbit-incident-runbook
jeremylongshore/claude-code-plugins-plus-skills
346
这是一份全面的CodeRabbit故障应急手册,提供了处理服务中断、PR合并受阻或评论错误的分步指南。内容涵盖了快速排查、紧急绕过、环境检查、延时诊断和配置优化等步骤,确保在CodeRabbit功能失效时也能维持开发流程的连续性。
查看详情
实现Customer.io高可用集成模式
customerio-reliability-patterns
jeremylongshore/claude-code-plugins-plus-skills
443
本技能包指导如何为Customer.io集成实现容错和高可用性。涵盖了熔断器(Circuit Breaker)防止连锁故障、带抖动的重试机制(Retry with Jitter)处理瞬时错误,以及使用Redis构建回退队列(Fallback Queue),确保应用在外部服务中断时也能稳定运行。
查看详情
Evernote故障应急手册
evernote-incident-runbook
jeremylongshore/claude-code-plugins-plus-skills
434
本手册是处理Evernote集成关键故障的详细流程指南。它涵盖了API中断、持续的速率限制、认证失败以及数据同步等问题的诊断和处理。当系统发生生产故障或服务中断时,遵循本手册可确保快速、系统地执行事件响应,包括激活熔断器和实现降级服务策略。
查看详情
Gamma故障应急手册
gamma-incident-runbook
jeremylongshore/claude-code-plugins-plus-skills
374
本手册为Gamma集成故障的综合应急响应指南。它提供了结构化的分步诊断流程,用于应对生产环境中的各种严重故障,包括服务完全中断、API错误、请求限速和高延迟等问题,确保故障排除流程的系统性和高效性。
查看详情
LangChain生产事故处理手册
langchain-incident-runbook
jeremylongshore/claude-code-plugins-plus-skills
185
本手册提供了LangChain及大型语言模型(LLM)生产环境的标准化操作流程(SOP)。它详细指导运维工程师如何处理常见的突发故障,包括服务商中断、错误率飙升、延迟增加和成本超支等问题,并提供了相应的检测、诊断和缓解措施,是维护LLM应用的关键运维工具。
查看详情
Langfuse事件排障手册
langfuse-incident-runbook
jeremylongshore/claude-code-plugins-plus-skills
282
这是一份完整的Langfuse故障排查和应急响应手册。它提供了从初始故障分级、系统状态检查到解决常见问题(如追踪丢失、速率限制或服务中断)的详细步骤,确保用户能够快速恢复LLM应用的观测性监控。
查看详情
事后总结报告撰写指南
postmortem-writing
sickn33/antigravity-awesome-skills
263
本指南提供了一套完整的流程,用于撰写高质量、无指责的事后总结报告(Postmortem)。它指导用户如何系统性地记录事故时间线、进行根本原因分析(RCA),识别系统性缺陷和改进点。掌握此技能能帮助团队从故障中吸取经验,建立持续学习文化,从而有效防止服务中断的再次发生。
查看详情
Replit故障应急处理手册
replit-incident-runbook
jeremylongshore/claude-code-plugins-plus-skills
319
本手册提供了一套完整的Replit平台故障应急响应流程。它涵盖了从P1到P4不同严重等级的事件处理,用于指导用户快速完成故障分级、诊断部署崩溃、数据库连接中断和平台级宕机。提供了详细的排障、修复、回滚步骤和沟通模板,帮助开发者快速定位问题并恢复服务。
查看详情
Replit资源限速与配额控制
replit-rate-limits
jeremylongshore/claude-code-plugins-plus-skills
392
本指南指导开发者如何为基于 Replit 的应用实现健壮的速率限制和资源配额管理。内容涵盖了如何监控 KV 数据库使用率、使用 Express 等框架实现 API 级别的限流中间件,以及应用指数退避(Exponential Backoff)和请求队列机制,确保应用在接近服务限制时仍保持稳定运行,防止因配额超限导致的服务中断。
查看详情
高可靠性Sentry错误追踪模式
sentry-reliability-patterns
jeremylongshore/claude-code-plugins-plus-skills
349
本指南提供了一套构建高可靠性Sentry错误追踪的模式。它解决了SDK初始化失败、网络中断和进程退出等关键故障场景。通过实现优雅降级、电路断路器和持久化离线队列,确保应用程序的核心功能在外部错误追踪服务不可用时也能保持稳定运行和高可用性。
查看详情
Speak API故障应急手册
speak-incident-runbook
jeremylongshore/claude-code-plugins-plus-skills
151
本工具提供了一套完整的Speak API故障应急流程手册。它指导用户如何应对API服务中断,包括故障分级、切换离线模式以及执行系统恢复步骤。适用于维护依赖实时AI服务的语言学习平台和DevOps运维场景。
查看详情
1
2
下一页
语言
简体中文
English