登录
下载
Skill UI
浏览并发现
9688+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
指导
,共找到
68
条记录
默认排序
最新上传
最多下载
事件响应指挥框架
incident-commander
alirezarezvani/claude-skills
347
这是一个全面的SRE/DevOps框架,指导团队完成整个事件生命周期:从检测、响应、解决到事后回顾。它提供自动化严重性分类、从散乱日志中重构时间线,以及结构化的事后回顾(PIR)生成功能,确保在重大故障期间实现高效的指挥和控制。
查看详情
事件应急响应手册模板
incident-runbook-templates
sickn33/antigravity-awesome-skills
380
提供一套完整的、生产级事件应急响应手册模板。指导用户处理重大技术事件的整个生命周期,包括从警报检测、初步分级、紧急缓解到根本原因分析和最终恢复,确保故障处理流程化、系统化。
查看详情
Istio流量管理指南
istio-traffic-management
sickn33/antigravity-awesome-skills
147
本指南提供了关于使用Istio在服务网格中进行高级流量管理和路由的全面指导。内容涵盖了金丝雀发布、蓝绿部署、熔断器设置、重试机制配置以及故障注入测试等关键技术。提供VirtualService、DestinationRule和Gateway等资源的YAML模板,帮助用户实现高可用、高可靠的生产级服务部署。
查看详情
Juicebox事件应急手册
juicebox-incident-runbook
jeremylongshore/claude-code-plugins-plus-skills
316
本手册详细提供了Juicebox AI平台全面的事件应急响应流程。它指导用户诊断和解决API中断、数据损坏、配额耗尽和导出失败等关键系统故障,旨在确保招聘和人才情报工作流程的连续性和稳定性。
查看详情
Langfuse 企业级权限与访问控制
langfuse-enterprise-rbac
jeremylongshore/claude-code-plugins-plus-skills
266
本指南详细介绍了Langfuse的企业级RBAC和安全性配置。它指导用户如何设置基于角色的权限(Owner, Admin等),实施项目隔离、范围受限的API密钥,整合SSO单点登录,并配置全面的审计日志,确保多团队和生产环境的合规性与安全性。
查看详情
Linear事件应急处理手册
linear-incident-runbook
jeremylongshore/claude-code-plugins-plus-skills
215
本手册提供了一套完整的Linear生产环境事件处理流程。它指导用户按步骤诊断和解决包括API认证失败、速率限制、Webhook故障和平台停机等各类突发问题,确保系统能够快速、有效地恢复运行。
查看详情
云平台生产环境部署集成
maintainx-deploy-integration
jeremylongshore/claude-code-plugins-plus-skills
58
本技能指导用户如何将复杂的集成应用安全可靠地部署到生产云环境(如Google Cloud Run和Kubernetes)。内容涵盖最佳实践,包括编写多阶段Dockerfile、实现健康检查和就绪性检查端点,并使用云工具进行自动化和安全的部署,确保系统的高可用性。
查看详情
实时API监控与可观测性
monitoring-apis
jeremylongshore/claude-code-plugins-plus-skills
440
用于构建全面的实时API监控系统。它指导如何收集关键指标(如请求速率、延迟、错误率),配置健康和就绪检查点,搭建Grafana仪表盘,并实现基于服务等级目标(SLO)的告警。适用于需要确保API在生产环境中高可用性和高性能的复杂场景。
查看详情
可观测性系统设计与策略
observability-designer
alirezarezvani/claude-skills
429
本技能旨在指导构建生产级的可观测性体系。内容涵盖SLI/SLO框架设计、完善指标(Metrics)、日志(Logs)、链路追踪(Traces)三大支柱的落地应用。同时,重点关注仪表盘设计原则、告警优化(避免告警疲劳)和故障响应流程(Runbook),确保系统具备深度可观察性和高可靠性。
查看详情
服务等级目标监控指南
observability-monitoring-slo-implement
sickn33/antigravity-awesome-skills
177
本技能专注于服务等级目标(SLO)和服务等级指标(SLI)的实施,用于建立和维护服务可靠性标准。它指导用户设计全面的SLO框架、计算错误预算,并构建可靠的监控系统。适用于需要将服务可靠性目标与业务优先级对齐,实现数据驱动的性能管理和持续改进的工程场景。
查看详情
待命值班交接最佳实践
on-call-handoff-patterns
sickn33/antigravity-awesome-skills
265
本文档提供了一套完整的待命值班交接流程和模板。它指导工程师如何系统性地记录当前活跃事件、正在调查的问题、最近的系统变更以及即将发生的维护活动。目标是实现信息连续性,确保交接班次时上下文信息完整,从而保障事件响应的可靠性。
查看详情
编程前系统调研工作流
search-first
affaan-m/everything-claude-code
294
这是一个系统化的工作流,用于在开始编写自定义代码前进行充分的调研。它指导用户完成从需求分析、跨渠道(如npm、PyPI、GitHub)并行搜索、到根据可维护性、社区支持等维度评估候选方案的全过程。目的是避免重复造轮子,确保使用现有成熟的库和最佳实践。
查看详情
上一页
1
2
3
4
5
6
下一页
语言
简体中文
English