登录
下载
Skill UI
浏览并发现
9979+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
自动恢复
,共找到
39
条记录
默认排序
最新上传
最多下载
谷歌管理自动化
google-admin-automation
ComposioHQ/awesome-claude-skills
450
通过 Rube MCP(Composio)工具集自动化 Google Workspace 管理:按步骤检查工具、建立连接后即可批量查询、创建用户、管理群组与成员、暂停/恢复账户、添加别名等常见工作流,适用于日常运维与入离职流程。
查看详情
备份策略实施
implementing-backup-strategies
jeremylongshore/claude-code-plugins-plus-skills
442
生成并实现数据库和应用的备份策略,提供生产级配置和自动化脚本,确保跨平台的数据安全、可扩展保护与灾备恢复准备。
查看详情
自动化事件响应工作流
incident-response-incident-response
sickn33/antigravity-awesome-skills
477
本技能提供了一个基于现代SRE(站点可靠性工程)的最佳实践的完整事件响应工作流。它指导用户完成从事件的初始检测、分级(P0-P3),到通过可观测性分析、深度调试、安全评估进行根因分析(RCA),最终实现系统恢复和总结复盘的全过程。适用于处理所有关键的系统故障、性能下降或安全事件。
查看详情
AI驱动的智能故障排除流程
incident-response-smart-fix
sickn33/antigravity-awesome-skills
397
本技能提供了一个基于多智能体编排的复杂生产环境故障排除流程。它将AI代码助手、可观测性平台和自动化工具(如分布式追踪、Git bisect)结合,形成“分析-调查-修复-验证”的完整闭环。旨在指导用户解决跨系统的复杂Bug,显著降低平均恢复时间(MTTR),提升系统整体的韧性和稳定性。
查看详情
数据库恢复管理
managing-database-recovery
jeremylongshore/claude-code-plugins-plus-skills
200
使用 database-recovery-manager 插件,自动化灾难恢复、时点恢复和故障转移配置,简化备份校验与恢复测试,满足生产数据库的恢复需求。
查看详情
部署回退管理
managing-deployment-rollbacks
jeremylongshore/claude-code-plugins-plus-skills
77
该技能自动化执行部署回退,通过安全检查将系统恢复到已知的稳定版本,并在回退后检测应用健康状态,适用于部署失败或性能异常等场景。
查看详情
Ray Train 分布式协调
ray-train
Orchestra-Research/AI-Research-SKILLs
64
Ray Train 统一协调 PyTorch、TensorFlow 与 HuggingFace 的分布式训练,从单机扩展到多节点集群,自动处理显卡分配、容错、断点恢复与超参搜索,帮助团队在无需大量改动的前提下完成大规模模型训练。
查看详情
系统混沌工程及弹性测试
running-chaos-tests
jeremylongshore/claude-code-plugins-plus-skills
112
用于执行受控的混沌工程实验,主动测试系统的弹性、容错能力和故障恢复机制。通过模拟网络延迟、服务崩溃、资源耗尽等真实故障,确保分布式系统能够优雅降级并自动恢复,是验证现代微服务架构健壮性的关键工具。
查看详情
SkyPilot 多云作业编排
skypilot-multi-cloud-orchestration
Orchestra-Research/AI-Research-SKILLs
376
SkyPilot 提供面向机器学习的多云编排,自动选取最优云/区域、恢复抢占型实例、管理多节点训练与模型服务,帮助团队降低 GPU 费用并规避供应商锁定。
查看详情
站点可靠性蓝图
sre-engineer
Jeffallan/claude-skills
409
提供 SRE 工作流,涵盖 SLO 定义、误差预算、监控报警、自动化、混沌实验和事件响应,帮助团队在规模化环境中保持可靠性并快速恢复。
查看详情
Neon无服务器Postgres指南
using-neon
sickn33/antigravity-awesome-skills
225
Neon提供了一个强大的无服务器Postgres平台,实现了计算和存储的解耦,支持自动伸缩、分支管理和即时恢复等高级功能。本指南详细介绍了Neon的配置、连接方法和使用场景,兼容标准Postgres,并与多种编程语言、ORM和开发工具无缝集成,用于构建高可靠性的数据系统。
查看详情
Vast.ai分布式训练与成本管理
vastai-core-workflow-b
jeremylongshore/claude-code-plugins-plus-skills
439
这是一个高级工作流,用于在Vast.ai上编排复杂的、多节点的GPU集群。它专为大规模分布式机器学习训练设计,能自动处理Spot机中断和使用检查点进行作业恢复。同时,该工作流提供全面的成本分析功能,帮助用户跟踪账单历史,优化GPU支出,并安全地销毁集群以停止计费。
查看详情
上一页
1
2
3
4
下一页
语言
简体中文
English