登录
下载
Skill UI
浏览并发现
9785+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
故障处理
,共找到
95
条记录
默认排序
最新上传
最多下载
自动化事件响应工作流
incident-response-incident-response
sickn33/antigravity-awesome-skills
477
本技能提供了一个基于现代SRE(站点可靠性工程)的最佳实践的完整事件响应工作流。它指导用户完成从事件的初始检测、分级(P0-P3),到通过可观测性分析、深度调试、安全评估进行根因分析(RCA),最终实现系统恢复和总结复盘的全过程。适用于处理所有关键的系统故障、性能下降或安全事件。
查看详情
事件应急响应手册模板
incident-runbook-templates
sickn33/antigravity-awesome-skills
380
提供一套完整的、生产级事件应急响应手册模板。指导用户处理重大技术事件的整个生命周期,包括从警报检测、初步分级、紧急缓解到根本原因分析和最终恢复,确保故障处理流程化、系统化。
查看详情
Instantly故障应急处理手册
instantly-incident-runbook
jeremylongshore/claude-code-plugins-plus-skills
430
本手册提供Instantly.ai平台的结构化故障应急响应流程。它涵盖了账户健康危机、活动失败、送达率骤降和API宕机等严重事件。通过分级(P1-P4)的故障排查、缓解和恢复步骤,使用代码示例指导用户进行系统性、快速的故障处理。
查看详情
Juicebox生产环境就绪度检查清单
juicebox-prod-checklist
jeremylongshore/claude-code-plugins-plus-skills
425
本清单是用于指导Juicebox AI人才搜索和分析平台在生产环境中的操作验证流程。它确保了系统具备高可靠性、数据安全性和业务连续性,涵盖了API密钥管理、限流机制、错误处理(如熔断器、指数退避)、数据加密(GDPR/CCPA合规)和全面的监控设置。该流程对于防止服务故障和维护搜索数据的准确性至关重要。
查看详情
Juicebox API速率限制管理
juicebox-rate-limits
jeremylongshore/claude-code-plugins-plus-skills
443
本指南提供了全面的Juicebox API速率限制处理策略和TypeScript实现。内容包括基于令牌桶算法的速率限制器、处理429错误和瞬时网络故障的重试策略,以及用于高效批量数据分析的工具函数。适用于构建需要高吞吐量、稳定稳定与Juicebox API交互的应用场景。
查看详情
Kling AI API错误诊断与修复
klingai-common-errors
jeremylongshore/claude-code-plugins-plus-skills
362
本技能提供了一份全面的Kling AI API错误参考手册。它详细介绍了各种HTTP状态码(如400、401、429)、任务失败原因(如内容违规、配图质量低)以及JWT令牌刷新和指数退避的错误处理方法。适用于视频生成或API集成出现故障时的故障排除和调试。
查看详情
LangChain生产事故处理手册
langchain-incident-runbook
jeremylongshore/claude-code-plugins-plus-skills
185
本手册提供了LangChain及大型语言模型(LLM)生产环境的标准化操作流程(SOP)。它详细指导运维工程师如何处理常见的突发故障,包括服务商中断、错误率飙升、延迟增加和成本超支等问题,并提供了相应的检测、诊断和缓解措施,是维护LLM应用的关键运维工具。
查看详情
LangChain API限流与重试策略
langchain-rate-limits
jeremylongshore/claude-code-plugins-plus-skills
451
本指南详细介绍了使用LangChain处理API限速(429错误)的多种高级策略,确保您的LLM应用在生产环境中具备高稳定性和高吞吐量。涵盖内置的指数级退避重试机制、控制并发请求量、实现提供商故障转移(Fallback)以及自定义令牌桶限流器,是构建可靠AI应用的必备技能。
查看详情
LangChain生产级模式指南
langchain-sdk-patterns
jeremylongshore/claude-code-plugins-plus-skills
443
本指南汇集了LangChain应用的生产级最佳实践。涵盖了结构化输出、提供商故障转移、异步批量处理、流式传输、缓存和重试逻辑等关键模式,帮助开发者构建更稳定、更高效、更健壮的LLM应用。
查看详情
AI智能体事件响应手册
lindy-incident-runbook
jeremylongshore/claude-code-plugins-plus-skills
170
本手册提供了一套完整的AI智能体事件响应流程,用于处理Lindy AI平台遇到的各种故障和停机情况。内容涵盖了平台整体故障(SEV1)、单个智能体失败、集成认证失效、信用点耗尽以及Webhook端点失败等关键场景。旨在提供结构化的诊断步骤和故障恢复策略,确保业务的连续性。
查看详情
Linear事件应急处理手册
linear-incident-runbook
jeremylongshore/claude-code-plugins-plus-skills
215
本手册提供了一套完整的Linear生产环境事件处理流程。它指导用户按步骤诊断和解决包括API认证失败、速率限制、Webhook故障和平台停机等各类突发问题,确保系统能够快速、有效地恢复运行。
查看详情
Linux系统故障排查工作流
linux-troubleshooting
sickn33/antigravity-awesome-skills
107
本工作流提供了一套系统化的、多阶段的指南,用于诊断和解决复杂的Linux系统问题。它涵盖了从资源瓶颈分析(CPU、内存、磁盘)到服务故障、网络诊断、日志分析等所有关键排查步骤,适用于处理生产环境事故的系统管理员和DevOps工程师。
查看详情
上一页
1
2
3
4
5
6
7
8
下一页
语言
简体中文
English