登录
下载
Skill UI
浏览并发现
9908+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
运维
,共找到
16
条记录
默认排序
最新上传
最多下载
专业DevOps故障排除指南
devops-troubleshooter
sickn33/antigravity-awesome-skills
458
本指南是深入的DevOps运维故障排除资源,涵盖了现代可观测性实践(如日志、指标、追踪)、Kubernetes和容器故障排查、复杂网络诊断、CI/CD流程优化以及多云平台问题解决。适用于进行系统根因分析、提升系统可靠性,解决复杂的跨领域运维问题。
查看详情
GitHub AI工作流自动化
github-workflow-automation
sickn33/antigravity-awesome-skills
261
本技能提供了一套基于AI的GitHub工作流自动化模式,旨在提升软件开发运维(DevOps)流程效率。它支持利用AI进行自动PR代码审查、根据Issue内容自动分配标签和撰写评论,并能在CI/CD流程中集成高级AI能力,极大优化了代码质量和项目管理。
查看详情
Sentry事故响应手册
sentry-incident-runbook
jeremylongshore/claude-code-plugins-plus-skills
442
基于Sentry的结构化事故响应流程。该手册指导用户从识别、分类(P0-P3)到深入调查,涵盖了使用堆栈跟踪、用户行为轨迹(breadcrumbs)以及API查询来确定根源、评估影响并撰写事故报告。适用于生产环境的故障排查和运维场景。
查看详情
运维运行手册生成器
runbook-generator
alirezarezvani/claude-skills
159
本工具能够根据服务名称快速生成完整的运维运行手册(Runbook)。它系统性地构建了部署、故障响应、维护和回滚等关键操作流程,旨在帮助团队标准化值班SOP,确保服务上线或发生故障时,所有人都遵循一致的、可重复的操作指引。
查看详情
企业级代理工作负载运维管理
enterprise-agent-ops
affaan-m/everything-claude-code
377
本技能旨在为云端托管或持续运行的代理工作负载提供全生命周期的运维管理。它覆盖了从部署、可观测性(日志、指标、追踪)到安全控制(最小权限、安全开关)的全流程,确保关键任务的稳定性和可审计性。
查看详情
BGP劫持漏洞模拟与测试
exploiting-bgp-hijacking-vulnerabilities
mukul975/Anthropic-Cybersecurity-Skills
263
本工具用于在隔离的实验环境中模拟BGP劫持和路由泄露攻击。它主要用于评估组织网络的安全防御能力,例如RPKI部署和路由源验证的有效性。通过模拟攻击流程,帮助网络运维团队验证BGP安全策略,但严禁用于生产网络。
查看详情
自动化审计与运维库存
automation-audit-ops
affaan-m/everything-claude-code
475
这是一个证据驱动的自动化审计工具,用于全面盘点企业级的自动化资源。它能帮助用户检查作业、钩子、连接器等组件的实时状态(是否运行、是否故障、是否冗余或缺失),从而在进行任何重大修改前,确保系统架构的稳定性和可靠性。
查看详情
KubeSphere核心:云原生平台管理
kubesphere-core
kubesphere/kubesphere
50
KubeSphere核心组件,作为基于Kubernetes的云原生应用管理操作系统。它提供统一的API聚合层,支持多集群和多租户管理。负责管理核心资源和复杂的API路由,极大简化了云原生应用的部署和运维操作。
查看详情
Qdrant性能故障诊断指南
qdrant-monitoring-debugging
github/awesome-copilot
312
本指南旨在提供系统化的Qdrant生产环境性能诊断流程。它详细指导用户如何排查三大核心问题:优化器卡死、内存占用过高(OOM)以及查询延迟慢。通过检查关键指标和API端点,帮助运维和开发人员快速定位性能瓶颈,确保系统稳定运行。
查看详情
ClickHouse可观测性监控配置
clickhouse-observability
jeremylongshore/claude-code-plugins-plus-skills
340
本指南提供了完整的ClickHouse可观测性监控解决方案。内容涵盖了如何利用系统表查询获取核心指标,如何将这些指标集成到Prometheus进行数据采集,并最终在Grafana上构建仪表盘。它用于监控生产环境的查询性能、数据合并健康度、资源使用和错误率,帮助运维人员进行系统调优和告警配置。
查看详情
Flexport事件应急手册
flexport-incident-runbook
jeremylongshore/claude-code-plugins-plus-skills
107
本手册是针对Flexport API集成故障的综合应急指南。它详细覆盖了API中断、Webhook丢失和供应链数据同步失败等各种突发事件。内容包括了严重程度分级、诊断步骤和详细的故障排查流程,旨在帮助运维人员快速定位问题并执行有效缓解措施。
查看详情
Glean搜索故障应急手册
glean-incident-runbook
jeremylongshore/claude-code-plugins-plus-skills
52
本手册是Glean企业搜索平台的专业故障应急响应指南。它系统化地覆盖了从P1级到P4级的各类故障情景,包括API中断、数据同步失败、索引积压和权限漂移等。内容提供了详细的诊断步骤、故障排除流程和沟通模板,旨在帮助技术运维和支持团队快速定位并解决搜索系统问题。
查看详情
1
2
下一页
语言
简体中文
English