登录
下载
Skill UI
浏览并发现
10245+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
缓解
,共找到
39
条记录
默认排序
最新上传
最多下载
Deepgram故障应急手册
deepgram-incident-runbook
jeremylongshore/claude-code-plugins-plus-skills
251
本手册提供了一套标准化的Deepgram生产环境故障应急流程。它指导用户进行自动化故障分级(SEV1-SEV4)、执行API连接和模型性能诊断,并提供了完整的缓解措施,包括构建故障回退服务和重放失败请求,确保服务中断或性能下降时业务的连续性。
查看详情
Exa API故障应急处理手册
exa-incident-runbook
jeremylongshore/claude-code-plugins-plus-skills
286
本手册提供了一套结构化的流程,用于处理Exa搜索API的故障和集成问题。内容涵盖了从初步故障排查、分析不同HTTP错误码(如401、429、5xx),到实施缓解措施,再到完成全面事后回顾和根本原因分析的完整步骤指南。
查看详情
Groq API故障应急手册
groq-incident-runbook
jeremylongshore/claude-code-plugins-plus-skills
316
本手册是针对Groq API故障的完整应急响应流程。它指导用户进行故障分级(P1-P4)和初步排查(检查状态、认证、速率限制)。内容包括错误决策树和实时的缓解措施,如启用备用模型或处理API密钥过期,确保在第三方服务中断时也能维持业务连续性。
查看详情
Guidewire故障应急手册
guidewire-incident-runbook
jeremylongshore/claude-code-plugins-plus-skills
334
本手册提供了一套系统化的流程,用于应对Guidewire生产环境突发的各类故障。它详细指导用户完成整个事件管理周期,包括初期的故障分诊(检查监控、API错误和批处理日志)、诊断性能瓶颈(如JVM和查询性能),以及执行缓解和升级处理,确保故障能够及时、规范地恢复。
查看详情
事件应急响应手册模板
incident-runbook-templates
sickn33/antigravity-awesome-skills
380
提供一套完整的、生产级事件应急响应手册模板。指导用户处理重大技术事件的整个生命周期,包括从警报检测、初步分级、紧急缓解到根本原因分析和最终恢复,确保故障处理流程化、系统化。
查看详情
Instantly故障应急处理手册
instantly-incident-runbook
jeremylongshore/claude-code-plugins-plus-skills
430
本手册提供Instantly.ai平台的结构化故障应急响应流程。它涵盖了账户健康危机、活动失败、送达率骤降和API宕机等严重事件。通过分级(P1-P4)的故障排查、缓解和恢复步骤,使用代码示例指导用户进行系统性、快速的故障处理。
查看详情
LangChain生产事故处理手册
langchain-incident-runbook
jeremylongshore/claude-code-plugins-plus-skills
185
本手册提供了LangChain及大型语言模型(LLM)生产环境的标准化操作流程(SOP)。它详细指导运维工程师如何处理常见的突发故障,包括服务商中断、错误率飙升、延迟增加和成本超支等问题,并提供了相应的检测、诊断和缓解措施,是维护LLM应用的关键运维工具。
查看详情
Lokalise故障应急手册
lokalise-incident-runbook
jeremylongshore/claude-code-plugins-plus-skills
108
本手册提供了一个结构化的流程,用于快速诊断和解决与Lokalise本地化服务相关的生产环境故障。它指导用户执行关键的快速诊断(API健康状态、Token有效性、速率限制),并根据缺失翻译、过时翻译、API宕机等常见故障模式提供决策树和修复步骤,确保快速缓解和完善事后分析。
查看详情
MaintainX集成故障应急处理手册
maintainx-incident-runbook
jeremylongshore/claude-code-plugins-plus-skills
491
本手册是维护X集成故障的综合应急指南。它为用户提供了从事件检测、严重性分级、现场故障排除到最终恢复的完整流程。用户可以系统地执行诊断步骤和缓解措施,确保在发生突发系统故障时,能够迅速、有序地恢复服务,并完成事后报告。
查看详情
Mistral AI故障应急手册
mistral-incident-runbook
jeremylongshore/claude-code-plugins-plus-skills
480
这是一份针对Mistral AI集成服务故障和中断的综合操作手册。它涵盖了故障等级划分、快速API健康检查、处理常见错误(如401、429、5xx)的决策树、即时缓解措施,以及事件发生后的证据收集和事后总结报告流程。
查看详情
OpenEvidence事件应急手册
openevidence-incident-runbook
jeremylongshore/claude-code-plugins-plus-skills
222
本文档是OpenEvidence平台专用的事件处理和应急响应手册。它详细定义了不同级别的严重性条件,并提供了从初步排查(Triage)到缓解和修复(Mitigation)的完整流程,帮助用户在系统发生API故障或性能下降时,快速、规范地进行故障排除和恢复。
查看详情
闪电注意力优化器
optimizing-attention-flash
Orchestra-Research/AI-Research-SKILLs
55
Flash Attention 优化器在训练或运行长序列 Transformer 时提供 2-4 倍加速和 10-20 倍内存削减,适用于缓解注意力显存瓶颈与推理延迟,支持 PyTorch 原生 SDPA、flash-attn 库、H100 FP8 及滑动窗口注意力等场景。
查看详情
1
2
3
4
下一页
语言
简体中文
English