登录
下载
Skill UI
浏览并发现
9688+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
追踪
,共找到
13
条记录
默认排序
最新上传
最多下载
专业DevOps故障排除指南
devops-troubleshooter
sickn33/antigravity-awesome-skills
458
本指南是深入的DevOps运维故障排除资源,涵盖了现代可观测性实践(如日志、指标、追踪)、Kubernetes和容器故障排查、复杂网络诊断、CI/CD流程优化以及多云平台问题解决。适用于进行系统根因分析、提升系统可靠性,解决复杂的跨领域运维问题。
查看详情
分布式系统故障诊断专家
error-diagnostics-error-analysis
sickn33/antigravity-awesome-skills
161
本技能是专业的故障分析专家,专注于复杂分布式系统的诊断和可靠性提升。适用于处理生产环境的突发事故、分析系统日志和追踪链,执行深层次的根因分析(RCA)。目标不仅是解决当前错误,更是建立预防机制,提升整体系统稳定性。
查看详情
错误追踪与可观测性专家
error-diagnostics-error-trace
sickn33/antigravity-awesome-skills
198
本技能是全面的错误监控和可观测性专家,指导用户搭建和优化生产环境的错误追踪系统。它涵盖了配置实时告警、实现结构化日志、错误分组、故障诊断和自动恢复策略,旨在显著提升系统的稳定性和问题解决效率。
查看详情
Groq集成可观测性监控
groq-observability
jeremylongshore/claude-code-plugins-plus-skills
61
本技能为Groq API集成提供了全面的可观测性监控方案。它通过客户端埋点,实时追踪首次生成时间(TTFT)、总延迟、吞吐量和成本消耗等关键性能指标。同时,它还配置了Prometheus指标和告警规则,用以监控速率限制和性能下降,确保生产环境的稳定可靠运行。
查看详情
可观测性系统设计与策略
observability-designer
alirezarezvani/claude-skills
429
本技能旨在指导构建生产级的可观测性体系。内容涵盖SLI/SLO框架设计、完善指标(Metrics)、日志(Logs)、链路追踪(Traces)三大支柱的落地应用。同时,重点关注仪表盘设计原则、告警优化(避免告警疲劳)和故障响应流程(Runbook),确保系统具备深度可观察性和高可靠性。
查看详情
Perplexity API 监控与可观测性
perplexity-observability
jeremylongshore/claude-code-plugins-plus-skills
144
本技能提供Perplexity Sonar API的全面监控解决方案。它追踪关键性能指标,包括延迟、调用成本、错误率和引文质量。适用于在生产环境中搭建监控仪表盘、配置告警规则,确保API的稳定性和高质量输出。
查看详情
PostHog集成健康度监控
posthog-observability
jeremylongshore/claude-code-plugins-plus-skills
418
用于监测PostHog集成系统的运行健康状态。它涵盖了事件摄取速率、功能开关评估延迟、事件总体量以及API配额消耗的追踪。通过设置Prometheus告警规则,可以确保数据管道的稳定运行,并对潜在的性能瓶颈或配额超限风险进行提前预警。
查看详情
技术债务追踪器
tech-debt-tracker
alirezarezvani/claude-skills
276
扫描代码库识别技术债务、量化严重性、追踪趋势并生成优先修复方案,帮助工程团队在新功能和重构之间做出平衡决策并向管理层汇报进展。
查看详情
Vast.ai GPU监控与成本追踪
vastai-observability
jeremylongshore/claude-code-plugins-plus-skills
241
本技能提供Vast.ai GPU实例的全面监控方案,可采集GPU利用率、实例运行状态、温度和成本累积等关键指标。适用于搭建监控仪表板、配置告警机制(如GPU空闲、过热、预算超支)以及自动化云资源使用跟踪,确保资源健康和成本可控。
查看详情
Windsurf审计日志配置
windsurf-audit-logging
jeremylongshore/claude-code-plugins-plus-skills
381
用于为Windsurf企业部署提供全面的审计日志记录功能。它涵盖AI交互记录、文件访问追踪、身份验证事件及配置变更的记录,帮助用户满足严格的合规性要求和进行深入的安全审计。
查看详情
企业级代理工作负载运维管理
enterprise-agent-ops
affaan-m/everything-claude-code
377
本技能旨在为云端托管或持续运行的代理工作负载提供全生命周期的运维管理。它覆盖了从部署、可观测性(日志、指标、追踪)到安全控制(最小权限、安全开关)的全流程,确保关键任务的稳定性和可审计性。
查看详情
Power Automate流监控与治理
flowstudio-power-automate-monitoring
github/awesome-copilot
492
该工具提供全面的企业级Power Automate流监控能力,可跨租户追踪流的运行健康状况、失败率、资产清单和治理报告。它通过缓存存储,避免了API速率限制,适用于治理团队进行平台健康度总览和根因分析。
查看详情
1
2
下一页
语言
简体中文
English