登录
下载
Skill UI
浏览并发现
9688+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
可观测性
,共找到
138
条记录
默认排序
最新上传
最多下载
SRE事件响应与管理
incident-responder
sickn33/antigravity-awesome-skills
376
本技能提供了一套专业的SRE级事件响应框架。它指导用户从初步的严重性评估、建立指挥系统,到利用可观测性工具(如分布式追踪、指标、日志)进行调查,直至完成系统恢复和撰写无过错的根本原因分析报告(Post-Mortem)。适用于处理复杂、大规模的系统故障和突发事件。
查看详情
自动化事件响应工作流
incident-response-incident-response
sickn33/antigravity-awesome-skills
477
本技能提供了一个基于现代SRE(站点可靠性工程)的最佳实践的完整事件响应工作流。它指导用户完成从事件的初始检测、分级(P0-P3),到通过可观测性分析、深度调试、安全评估进行根因分析(RCA),最终实现系统恢复和总结复盘的全过程。适用于处理所有关键的系统故障、性能下降或安全事件。
查看详情
AI驱动的智能故障排除流程
incident-response-smart-fix
sickn33/antigravity-awesome-skills
397
本技能提供了一个基于多智能体编排的复杂生产环境故障排除流程。它将AI代码助手、可观测性平台和自动化工具(如分布式追踪、Git bisect)结合,形成“分析-调查-修复-验证”的完整闭环。旨在指导用户解决跨系统的复杂Bug,显著降低平均恢复时间(MTTR),提升系统整体的韧性和稳定性。
查看详情
SaaS平台可观测性监控指南
juicebox-observability
jeremylongshore/claude-code-plugins-plus-skills
186
本指南提供了为SaaS平台(如Juicebox)构建可观测性监控的全面方法,包括关键性能指标(如搜索延迟、数据摄取速率、API错误率)的定义、TypeScript实现的代码片段、健康检查逻辑和警报规则。它旨在帮助开发者建立完整的运营监控系统,确保用户体验和数据准确性处于最佳状态。
查看详情
Kling AI API 调试与可观测性工具
klingai-debug-bundle
jeremylongshore/claude-code-plugins-plus-skills
296
这是一个用于Kling AI API集成的综合调试和可观测性工具。它能够自动捕获每一次API调用的请求/响应对、任务生命周期事件和详细的耗时指标。通过结构化日志记录,可以帮助开发者系统性地排查视频生成管道中的问题,确保构建的AI应用具备高可观测性。
查看详情
LangChain可观测性监控系统
langchain-observability
jeremylongshore/claude-code-plugins-plus-skills
168
本指南提供了一套完整的LangChain生产级可观测性解决方案。它整合了LangSmith零代码追踪、自定义回调函数进行指标捕获(如延迟、Token使用量、错误率),以及Prometheus导出器实现告警。帮助开发者实时监控整个LLM应用管线,确保系统性能和稳定性。
查看详情
LangChain生产环境就绪度清单
langchain-prod-checklist
jeremylongshore/claude-code-plugins-plus-skills
131
这是一份全面的LangChain应用程序生产环境就绪度清单。它系统性地覆盖了从配置管理、错误处理、可观测性(如LangSmith)、性能优化、安全加固(防止提示注入、处理PII)到严格测试和部署策略等多个维度,帮助开发者确保AI应用具备高可靠性和可维护性,适用于应用上线前或现有系统的审计。
查看详情
LangChain事件处理与流式集成
langchain-webhooks-events
jeremylongshore/claude-code-plugins-plus-skills
118
该技能用于实现LangChain的高级事件驱动模式。提供自定义回调处理器,可监听链式调用过程中的关键生命周期事件(如工具调用、LLM Token流式生成)。同时支持通过SSE和WebSocket进行实时数据流传输,并通过Webhook实现所有运行事件的聚合和可观测性追踪。
查看详情
Langfuse LLM 调用可观测性
langfuse-core-workflow-a
jeremylongshore/claude-code-plugins-plus-skills
448
本工作流展示了如何使用 Langfuse 为大型语言模型(LLM)调用、链式调用和复杂 Agent 实现端到端的完整追踪。它覆盖了包括 OpenAI 包装器、RAG 流程的手动 Span 追踪、流式响应监控以及多模型(如 OpenAI, Anthropic)的集成。适用于需要深入了解 AI 系统性能、调试复杂流程和监控生产环境 LLM 使用情况的场景。
查看详情
LLM可观测数据合规管理
langfuse-data-handling
jeremylongshore/claude-code-plugins-plus-skills
432
本技能用于管理大型语言模型(LLM)可观测性平台(如Langfuse)的完整数据生命周期。核心功能包括导出详细的调用轨迹和评分数据、配置数据保留策略、执行GDPR等合规操作,以及对个人身份信息(PII)进行脱敏处理。适用于需要确保AI应用数据安全和合规性的场景。
查看详情
部署Langfuse进行LLM可观测性
langfuse-deploy-integration
jeremylongshore/claude-code-plugins-plus-skills
288
本指南提供了一份全面的教程,指导开发者如何将Langfuse LLM可观测性集成到主流的云和无服务器环境中。内容覆盖了Vercel、AWS Lambda、Google Cloud Run和Docker等平台的最佳实践,确保了对整个AI工作流的完整追踪和性能监控。
查看详情
Langfuse多环境配置指南
langfuse-multi-env-setup
jeremylongshore/claude-code-plugins-plus-skills
107
本指南详细介绍了如何在多环境(开发、预发布、生产)中安全配置Langfuse。它涵盖了从环境密钥管理、使用秘密管理器到CI/CD流程中的最佳实践,确保不同环境数据隔离,防止敏感信息泄露,从而实现稳定的全流程可观测性追踪。
查看详情
上一页
1
2
3
4
5
6
7
...
10
11
12
下一页
语言
简体中文
English