登录
下载
Skill UI
浏览并发现
9688+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
监控
,共找到
31
条记录
默认排序
最新上传
最多下载
CoreWeave GPU工作负载事件监控
coreweave-webhooks-events
jeremylongshore/claude-code-plugins-plus-skills
416
该工具通过Webhook机制,实时监控CoreWeave集群的GPU工作负载状态和生命周期事件。它追踪Pod就绪状态、任务完成、存储挂载和节点健康状况,是构建大规模GPU推理和训练任务的自动化扩展、告警及恢复流程的核心组件。
查看详情
Fly.io 监控与自动化部署
flyio-webhooks-events
jeremylongshore/claude-code-plugins-plus-skills
131
本技能指导用户掌握Fly.io的系统监控和自动化部署流程。内容涵盖通过API轮询获取机器状态变化、设置健康检查端点、使用`jq`处理结构化日志以及在CI/CD流程中实现部署通知,旨在帮助用户确保应用的高可用性和系统可靠性。
查看详情
Hootsuite生产部署检查清单
hootsuite-prod-checklist
jeremylongshore/claude-code-plugins-plus-skills
474
本清单用于指导Hootsuite等社交媒体发布系统的生产环境部署和上线前的全面检查。它涵盖了API密钥管理、速率限制处理、熔断器和重试机制等关键系统架构点,并强调了时间区域验证、错误处理以及监控告警的设置。使用此清单确保自动化发布流程的稳定性和可靠性,避免上线后的发布中断或数据丢失。
查看详情
MQTT事件发布与自动化集成
mqtt-automation
SharpAI/DeepCamera
309
该工具用于将Aegis系统产生的各种关键事件(如人物检测、警报触发、剪辑完成等)实时发布到MQTT消息代理。它支持与Home Assistant、Node-RED等智能家居自动化平台深度集成,实现事件驱动的实时监控和联动控制。
查看详情
甲骨文云性能调优指南
oraclecloud-performance-tuning
jeremylongshore/claude-code-plugins-plus-skills
295
本技能旨在帮助用户深入理解甲骨文云基础设施(OCI)的性能特性。它详细介绍了如何根据工作负载选择最佳的计算形状和块存储性能等级(如高性能、超高性能)。用户通过代码可以查询可用资源,创建性能优化的卷,并实时监控IOPS和网络带宽,确保基础设施决策的准确性。
查看详情
Qdrant监控配置指南
qdrant-monitoring-setup
github/awesome-copilot
484
本指南提供了完整的Qdrant监控设置流程,覆盖了Prometheus指标采集、Kubernetes健康探针配置、告警机制搭建以及日志中央化处理。内容涵盖自部署和混合云环境的特殊要求,帮助用户实现全面的系统运营监控和合规审计。
查看详情
KubeSphere告警规则管理
whizard-telemetry-ruler
kubesphere/kubesphere
242
WizTelemetry Ruler是KubeSphere可观测性平台的核心组件,用于提供全面的告警和日志告警功能。它允许用户为K8s事件、审计记录和应用日志定义、管理告警规则,确保系统能够主动监控,并通过AlertManager等接收端及时发出预警。
查看详情
上一页
1
2
3
语言
简体中文
English