登录
下载
Skill UI
浏览并发现
9747+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
可靠性
,共找到
16
条记录
默认排序
最新上传
最多下载
多云成本优化策略指南
cost-optimization
sickn33/antigravity-awesome-skills
311
本指南提供系统化的多云成本优化方法论,覆盖AWS、Azure和GCP等主流云平台。内容涵盖了资源右缩容、预留容量利用、数据生命周期管理和成本监控等最佳实践,帮助用户有效降低云支出,同时维持高性能和高可靠性。
查看详情
数据工程:构建数据管道与仓库
data-engineer
sickn33/antigravity-awesome-skills
396
专业的系统级数据工程师,专注于构建和优化可扩展、高性能的现代数据管道和数据仓库。精通整个现代数据栈,掌握Apache Spark、dbt、Airflow等核心技术,并深入实践数据湖仓一体架构(Lakehouse)。涵盖数据清洗、实时流处理、数据治理和多云平台部署,确保数据流程的可靠性和可扩展性。
查看详情
专业DevOps故障排除指南
devops-troubleshooter
sickn33/antigravity-awesome-skills
458
本指南是深入的DevOps运维故障排除资源,涵盖了现代可观测性实践(如日志、指标、追踪)、Kubernetes和容器故障排查、复杂网络诊断、CI/CD流程优化以及多云平台问题解决。适用于进行系统根因分析、提升系统可靠性,解决复杂的跨领域运维问题。
查看详情
分布式系统故障诊断专家
error-diagnostics-error-analysis
sickn33/antigravity-awesome-skills
161
本技能是专业的故障分析专家,专注于复杂分布式系统的诊断和可靠性提升。适用于处理生产环境的突发事故、分析系统日志和追踪链,执行深层次的根因分析(RCA)。目标不仅是解决当前错误,更是建立预防机制,提升整体系统稳定性。
查看详情
Firecrawl生产环境部署清单
firecrawl-prod-checklist
jeremylongshore/claude-code-plugins-plus-skills
174
这是一份全面的清单,用于指导将使用Firecrawl核心API(抓取、爬取等)的应用安全部署到生产环境。内容涵盖了安全凭证管理、爬取安全限制、鲁棒的错误处理机制、监控告警设置以及系统回滚流程,确保部署的可靠性和稳定性。
查看详情
可观测性系统设计与策略
observability-designer
alirezarezvani/claude-skills
429
本技能旨在指导构建生产级的可观测性体系。内容涵盖SLI/SLO框架设计、完善指标(Metrics)、日志(Logs)、链路追踪(Traces)三大支柱的落地应用。同时,重点关注仪表盘设计原则、告警优化(避免告警疲劳)和故障响应流程(Runbook),确保系统具备深度可观察性和高可靠性。
查看详情
服务等级目标监控指南
observability-monitoring-slo-implement
sickn33/antigravity-awesome-skills
177
本技能专注于服务等级目标(SLO)和服务等级指标(SLI)的实施,用于建立和维护服务可靠性标准。它指导用户设计全面的SLO框架、计算错误预算,并构建可靠的监控系统。适用于需要将服务可靠性目标与业务优先级对齐,实现数据驱动的性能管理和持续改进的工程场景。
查看详情
待命值班交接最佳实践
on-call-handoff-patterns
sickn33/antigravity-awesome-skills
265
本文档提供了一套完整的待命值班交接流程和模板。它指导工程师如何系统性地记录当前活跃事件、正在调查的问题、最近的系统变更以及即将发生的维护活动。目标是实现信息连续性,确保交接班次时上下文信息完整,从而保障事件响应的可靠性。
查看详情
实现NERC CIP合规控制
implementing-nerc-cip-compliance-controls
mukul975/Anthropic-Cybersecurity-Skills
63
本技能指导用户实施和维护北美电网可靠性公司(NERC)关键基础设施保护(CIP)的合规控制措施。涵盖资产分类(CIP-002)、电子安全边界(CIP-005)、系统安全管理(CIP-007)等关键领域。适用于进行大量电力系统(BES)网络资产的审计、更新或建立合规性测量。
查看详情
备份完整性验证与恢复测试
validating-backup-integrity-for-recovery
mukul975/Anthropic-Cybersecurity-Skills
468
本技能提供了一套完整的备份可靠性验证框架。它自动化了加密哈希验证、在隔离环境中的模拟恢复测试、检测静默数据损坏(位翻转)以及扫描勒索软件痕迹。在发生重大事件或勒索软件攻击前使用,确保数据可恢复性和合规性。
查看详情
自动化审计与运维库存
automation-audit-ops
affaan-m/everything-claude-code
475
这是一个证据驱动的自动化审计工具,用于全面盘点企业级的自动化资源。它能帮助用户检查作业、钩子、连接器等组件的实时状态(是否运行、是否故障、是否冗余或缺失),从而在进行任何重大修改前,确保系统架构的稳定性和可靠性。
查看详情
Attio生产环境集成部署清单
attio-prod-checklist
jeremylongshore/claude-code-plugins-plus-skills
135
本清单提供了一个系统化的流程,用于确保Attio API集成在生产环境中顺利、稳定地上线。它覆盖了关键的工程实践,包括身份验证、高级错误处理(指数退避、重试)、速率限制、数据完整性校验、健康检查和回滚机制,是保障SaaS系统可靠性的必备指南。
查看详情
1
2
下一页
语言
简体中文
English