下载

Skill UI

浏览并发现 9746+ 精选技能

全部编程开发人工智能设计创意产品商业数据科学市场营销职场通用效率工具硬件工程语言学习

搜索可靠，共找到 86 条记录

默认排序最新上传最多下载

大语言模型智能体评估

agent-evaluation

sickn33/antigravity-awesome-skills

这是一个用于全面测试和评估大型语言模型（LLM）智能体的框架。它超越了简单的通过/失败判断，深入评估智能体的复杂行为、可靠性指标和能力一致性。适用于生产环境的监控，帮助识别高级AI智能体中的微妙故障模式。

智能体性能优化工作流

agent-orchestration-improve-agent

sickn33/antigravity-awesome-skills

本工作流提供了一个系统性的框架，用于提升现有AI智能体的性能和可靠性。流程包括全面性能指标分析、详细的故障模式分类、高级提示词工程优化（如思维链和宪法AI），并最终通过结构化的A/B测试和受控部署，实现可量化、鲁棒的性能提升。

多智能体系统优化工具

agent-orchestration-multi-agent-optimize

sickn33/antigravity-awesome-skills

这是一个先进的人工智能驱动框架，用于进行多智能体系统的整体性能工程优化。它提供协调的性能分析、工作负载分配和成本感知编排，覆盖数据库、应用层和前端等多个领域。可用于识别系统瓶颈，提高吞吐量，增强复杂智能体工作流的可靠性和效率。

AI产品开发

sickn33/antigravity-awesome-skills

指导团队打造可靠的AI产品，涵盖LLM集成、RAG架构、可扩展提示词工程、可信AI UX与成本友好策略。

可靠自治智能体指南

autonomous-agents

sickn33/antigravity-awesome-skills

介绍构建可靠自治代理的原则、模式、分解策略与工具，强调领域约束、人工审核与审计以阻止错误级联。

Claude代码开发最佳实践指南

claude-code-guide

sickn33/antigravity-awesome-skills

这份指南旨在提供一个全面参考，帮助用户最大化利用Claude Code（一个智能体编程工具）的潜力。内容涵盖了最佳实践、项目配置模板（CLAUDE.md）、高级提示工程技巧和调试策略，指导用户实现高效、可靠的自主软件开发流程。

币排行自动化操作指南

coinranking-automation

ComposioHQ/awesome-claude-skills

通过 Rube MCP 和 Composio 的 Coinranking 工具包自动化币排行操作，强调先搜索工具、确认连接、遵守 schema、复用会话与批量执行等关键步骤，确保流程稳定可靠。

模型上下文衰减模式

context-degradation

sickn33/antigravity-awesome-skills

本技能深入解析大型语言模型在处理长上下文时，性能衰退的几种可预测模式。内容覆盖了“中心信息遗忘”、“上下文污染”、“信息干扰”等核心现象。帮助开发者诊断AI代理的性能瓶颈，并指导如何设计出更健壮、更可靠的长文本处理系统。

Convolo AI 自动化流程

convolo-ai-automation

ComposioHQ/awesome-claude-skills

指导通过 Composio 的 Rube MCP 自动化 Convolo AI 操作，覆盖工具发现、连接验证、按 schema 执行多工具、会话复用与分页处理，确保运行可靠。

Databricks ML模型全生命周期管理

databricks-core-workflow-b

jeremylongshore/claude-code-plugins-plus-skills

本流程展示了在Databricks上完整的MLOps生命周期。它指导用户如何使用Feature Store进行特征工程，通过MLflow进行实验跟踪和模型训练，在Model Registry中管理模型版本，最终部署为可实时推理的API服务。适用于构建可生产化、高可靠性的机器学习系统。

声明式语言模型系统

Orchestra-Research/AI-Research-SKILLs

DSPy 通过声明式方式构建复杂语言模型系统，组合模块化的 RAG 和智能代理流程，并自动优化提示与模块，提升 LM 应用的可靠性与可维护性。

Claude 评估驱动框架

affaan-m/everything-claude-code

Claude Code正式评估框架，先定义能力与回归标准，再用代码/模型/人工评估多个阶段，并持续跟踪pass@k和pass^k等可靠性指标以确保交付质量。

12 3 4...6 7 8 下一页

语言