下载

Skill UI

浏览并发现 9688+ 精选技能

全部编程开发人工智能设计创意产品商业数据科学市场营销职场通用效率工具硬件工程语言学习

搜索可观测性，共找到 138 条记录

默认排序最新上传最多下载

SRE事件响应与管理

incident-responder

sickn33/antigravity-awesome-skills

本技能提供了一套专业的SRE级事件响应框架。它指导用户从初步的严重性评估、建立指挥系统，到利用可观测性工具（如分布式追踪、指标、日志）进行调查，直至完成系统恢复和撰写无过错的根本原因分析报告（Post-Mortem）。适用于处理复杂、大规模的系统故障和突发事件。

自动化事件响应工作流

incident-response-incident-response

sickn33/antigravity-awesome-skills

本技能提供了一个基于现代SRE（站点可靠性工程）的最佳实践的完整事件响应工作流。它指导用户完成从事件的初始检测、分级（P0-P3），到通过可观测性分析、深度调试、安全评估进行根因分析（RCA），最终实现系统恢复和总结复盘的全过程。适用于处理所有关键的系统故障、性能下降或安全事件。

AI驱动的智能故障排除流程

incident-response-smart-fix

sickn33/antigravity-awesome-skills

本技能提供了一个基于多智能体编排的复杂生产环境故障排除流程。它将AI代码助手、可观测性平台和自动化工具（如分布式追踪、Git bisect）结合，形成“分析-调查-修复-验证”的完整闭环。旨在指导用户解决跨系统的复杂Bug，显著降低平均恢复时间（MTTR），提升系统整体的韧性和稳定性。

SaaS平台可观测性监控指南

juicebox-observability

jeremylongshore/claude-code-plugins-plus-skills

本指南提供了为SaaS平台（如Juicebox）构建可观测性监控的全面方法，包括关键性能指标（如搜索延迟、数据摄取速率、API错误率）的定义、TypeScript实现的代码片段、健康检查逻辑和警报规则。它旨在帮助开发者建立完整的运营监控系统，确保用户体验和数据准确性处于最佳状态。

Kling AI API 调试与可观测性工具

klingai-debug-bundle

jeremylongshore/claude-code-plugins-plus-skills

这是一个用于Kling AI API集成的综合调试和可观测性工具。它能够自动捕获每一次API调用的请求/响应对、任务生命周期事件和详细的耗时指标。通过结构化日志记录，可以帮助开发者系统性地排查视频生成管道中的问题，确保构建的AI应用具备高可观测性。

LangChain可观测性监控系统

langchain-observability

jeremylongshore/claude-code-plugins-plus-skills

本指南提供了一套完整的LangChain生产级可观测性解决方案。它整合了LangSmith零代码追踪、自定义回调函数进行指标捕获（如延迟、Token使用量、错误率），以及Prometheus导出器实现告警。帮助开发者实时监控整个LLM应用管线，确保系统性能和稳定性。

LangChain生产环境就绪度清单

langchain-prod-checklist

jeremylongshore/claude-code-plugins-plus-skills

这是一份全面的LangChain应用程序生产环境就绪度清单。它系统性地覆盖了从配置管理、错误处理、可观测性（如LangSmith）、性能优化、安全加固（防止提示注入、处理PII）到严格测试和部署策略等多个维度，帮助开发者确保AI应用具备高可靠性和可维护性，适用于应用上线前或现有系统的审计。

LangChain事件处理与流式集成

langchain-webhooks-events

jeremylongshore/claude-code-plugins-plus-skills

该技能用于实现LangChain的高级事件驱动模式。提供自定义回调处理器，可监听链式调用过程中的关键生命周期事件（如工具调用、LLM Token流式生成）。同时支持通过SSE和WebSocket进行实时数据流传输，并通过Webhook实现所有运行事件的聚合和可观测性追踪。

Langfuse LLM 调用可观测性

langfuse-core-workflow-a

jeremylongshore/claude-code-plugins-plus-skills

本工作流展示了如何使用 Langfuse 为大型语言模型（LLM）调用、链式调用和复杂 Agent 实现端到端的完整追踪。它覆盖了包括 OpenAI 包装器、RAG 流程的手动 Span 追踪、流式响应监控以及多模型（如 OpenAI, Anthropic）的集成。适用于需要深入了解 AI 系统性能、调试复杂流程和监控生产环境 LLM 使用情况的场景。

LLM可观测数据合规管理

langfuse-data-handling

jeremylongshore/claude-code-plugins-plus-skills

本技能用于管理大型语言模型（LLM）可观测性平台（如Langfuse）的完整数据生命周期。核心功能包括导出详细的调用轨迹和评分数据、配置数据保留策略、执行GDPR等合规操作，以及对个人身份信息（PII）进行脱敏处理。适用于需要确保AI应用数据安全和合规性的场景。

部署Langfuse进行LLM可观测性

langfuse-deploy-integration

jeremylongshore/claude-code-plugins-plus-skills

本指南提供了一份全面的教程，指导开发者如何将Langfuse LLM可观测性集成到主流的云和无服务器环境中。内容覆盖了Vercel、AWS Lambda、Google Cloud Run和Docker等平台的最佳实践，确保了对整个AI工作流的完整追踪和性能监控。

Langfuse多环境配置指南

langfuse-multi-env-setup

jeremylongshore/claude-code-plugins-plus-skills

本指南详细介绍了如何在多环境（开发、预发布、生产）中安全配置Langfuse。它涵盖了从环境密钥管理、使用秘密管理器到CI/CD流程中的最佳实践，确保不同环境数据隔离，防止敏感信息泄露，从而实现稳定的全流程可观测性追踪。

上一页 1 2 345 6 7...10 11 12 下一页

语言