登录
下载
Skill UI
浏览并发现
9185+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
问题
,共找到
25
条记录
默认排序
最新上传
最多下载
Qdrant性能故障诊断指南
qdrant-monitoring-debugging
github/awesome-copilot
312
本指南旨在提供系统化的Qdrant生产环境性能诊断流程。它详细指导用户如何排查三大核心问题:优化器卡死、内存占用过高(OOM)以及查询延迟慢。通过检查关键指标和API端点,帮助运维和开发人员快速定位性能瓶颈,确保系统稳定运行。
查看详情
Figma API故障排查手册
figma-incident-runbook
jeremylongshore/claude-code-plugins-plus-skills
76
本手册提供了一套完整的Figma API故障应急响应流程。它指导用户如何进行快速故障排查,包括检查API状态、认证令牌和限速问题。内容涵盖了基于不同错误代码(如403、429、500)的决策树,以及应用即时缓解措施(如令牌轮换、数据缓存回退)和撰写完整的故障复盘报告,确保系统稳定运行。
查看详情
Fly.io 常见错误排查指南
flyio-common-errors
jeremylongshore/claude-code-plugins-plus-skills
330
本指南是用于诊断和解决 Fly.io 平台常见运行时和部署错误的快速参考手册。内容涵盖了健康检查失败、镜像构建失败、机器启动问题、连接拒绝等问题,提供了具体的诊断命令和配置修复方案,帮助用户快速定位并解决部署和运行中的故障。
查看详情
Anthropic API故障应急手册
anth-incident-runbook
jeremylongshore/claude-code-plugins-plus-skills
129
本手册提供了一个全面的指南,用于诊断和解决在使用Claude API时遇到的各种故障、性能下降和速率限制问题。它提供了从P1到P4的结构化分级响应流程、决策树和缓解措施,帮助工程师快速恢复服务,确保系统稳定运行。
查看详情
Canva API故障应急处理手册
canva-incident-runbook
jeremylongshore/claude-code-plugins-plus-skills
313
本手册是一份结构化的故障应急响应指南,专门用于处理与Canva Connect API相关的集成故障。它指导用户进行初步问题排查、处理401/429/5xx等常见错误,并涵盖了内部和外部的沟通模板、故障证据收集和详细的事故回顾(Postmortem)流程,确保快速恢复服务。
查看详情
CoreWeave故障排查手册
coreweave-incident-runbook
jeremylongshore/claude-code-plugins-plus-skills
430
这是一份用于CoreWeave平台的关键生产环境故障排除手册。它提供了应对GPU工作负载故障、推理服务宕机或Kubernetes资源问题的结构化步骤,指导用户检查Pod状态、节点健康和模型加载错误,以实现快速恢复服务。
查看详情
Datadog日志分析与事故排查
datadog
nexu-io/nexu
204
本指南提供了在Nexu平台使用Datadog日志API进行生产环境故障排查的完整流程。它指导用户如何查询崩溃事件、分析OpenClaw的标准错误输出、检查网关启动状态以及审查API请求日志。内容包括认证要求、按Pod和时间范围过滤的最佳实践,并提供了使用Python解析原始日志的步骤,帮助用户快速定位生产问题。
查看详情
Flexport事件应急手册
flexport-incident-runbook
jeremylongshore/claude-code-plugins-plus-skills
107
本手册是针对Flexport API集成故障的综合应急指南。它详细覆盖了API中断、Webhook丢失和供应链数据同步失败等各种突发事件。内容包括了严重程度分级、诊断步骤和详细的故障排查流程,旨在帮助运维人员快速定位问题并执行有效缓解措施。
查看详情
Fly.io 调试诊断工具包
flyio-debug-bundle
jeremylongshore/claude-code-plugins-plus-skills
342
这是一个用于收集Fly.io应用全套诊断证据的工具包。它能捕获机器状态、应用日志、卷信息、网络诊断等关键数据,为用户提供完整的故障排除资料,用于解决部署卡顿、机器故障或网络连接问题。
查看详情
Glean搜索故障应急手册
glean-incident-runbook
jeremylongshore/claude-code-plugins-plus-skills
52
本手册是Glean企业搜索平台的专业故障应急响应指南。它系统化地覆盖了从P1级到P4级的各类故障情景,包括API中断、数据同步失败、索引积压和权限漂移等。内容提供了详细的诊断步骤、故障排除流程和沟通模板,旨在帮助技术运维和支持团队快速定位并解决搜索系统问题。
查看详情
KubeSphere OpenKruise 管理指南
kubesphere-openkruise
kubesphere/kubesphere
272
本技能提供了一份完整的OpenKruise在KubeSphere环境下的生命周期管理指南。用户可以使用它来执行OpenKruise的安装、升级、状态查询、生成高级工作负载清单(如SidecarSet/CloneSet),以及解决Pod、CRD和Webhook等复杂的运行时故障问题,支持通过kubectl和KubeSphere API进行操作。
查看详情
OneNote容器化生产部署
onenote-deploy-integration
jeremylongshore/claude-code-plugins-plus-skills
246
专为OneNote服务设计的高级容器部署方案。它解决了容器化环境中的关键问题,包括MSAL令牌的持久化存储(支持文件和Redis缓存),通过健康检查验证Graph API的实际连通性,并实现了优雅的停机处理。适用于将OneNote服务部署到Docker或Kubernetes等生产级环境,确保系统稳定可靠。
查看详情
上一页
1
2
3
下一页
语言
简体中文
English