登录
下载
Skill UI
浏览并发现
9746+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
可靠
,共找到
86
条记录
默认排序
最新上传
最多下载
大语言模型智能体评估
agent-evaluation
sickn33/antigravity-awesome-skills
271
这是一个用于全面测试和评估大型语言模型(LLM)智能体的框架。它超越了简单的通过/失败判断,深入评估智能体的复杂行为、可靠性指标和能力一致性。适用于生产环境的监控,帮助识别高级AI智能体中的微妙故障模式。
查看详情
智能体性能优化工作流
agent-orchestration-improve-agent
sickn33/antigravity-awesome-skills
398
本工作流提供了一个系统性的框架,用于提升现有AI智能体的性能和可靠性。流程包括全面性能指标分析、详细的故障模式分类、高级提示词工程优化(如思维链和宪法AI),并最终通过结构化的A/B测试和受控部署,实现可量化、鲁棒的性能提升。
查看详情
多智能体系统优化工具
agent-orchestration-multi-agent-optimize
sickn33/antigravity-awesome-skills
165
这是一个先进的人工智能驱动框架,用于进行多智能体系统的整体性能工程优化。它提供协调的性能分析、工作负载分配和成本感知编排,覆盖数据库、应用层和前端等多个领域。可用于识别系统瓶颈,提高吞吐量,增强复杂智能体工作流的可靠性和效率。
查看详情
AI产品开发
ai-product
sickn33/antigravity-awesome-skills
306
指导团队打造可靠的AI产品,涵盖LLM集成、RAG架构、可扩展提示词工程、可信AI UX与成本友好策略。
查看详情
可靠自治智能体指南
autonomous-agents
sickn33/antigravity-awesome-skills
325
介绍构建可靠自治代理的原则、模式、分解策略与工具,强调领域约束、人工审核与审计以阻止错误级联。
查看详情
Claude代码开发最佳实践指南
claude-code-guide
sickn33/antigravity-awesome-skills
441
这份指南旨在提供一个全面参考,帮助用户最大化利用Claude Code(一个智能体编程工具)的潜力。内容涵盖了最佳实践、项目配置模板(CLAUDE.md)、高级提示工程技巧和调试策略,指导用户实现高效、可靠的自主软件开发流程。
查看详情
币排行自动化操作指南
coinranking-automation
ComposioHQ/awesome-claude-skills
204
通过 Rube MCP 和 Composio 的 Coinranking 工具包自动化币排行操作,强调先搜索工具、确认连接、遵守 schema、复用会话与批量执行等关键步骤,确保流程稳定可靠。
查看详情
模型上下文衰减模式
context-degradation
sickn33/antigravity-awesome-skills
100
本技能深入解析大型语言模型在处理长上下文时,性能衰退的几种可预测模式。内容覆盖了“中心信息遗忘”、“上下文污染”、“信息干扰”等核心现象。帮助开发者诊断AI代理的性能瓶颈,并指导如何设计出更健壮、更可靠的长文本处理系统。
查看详情
Convolo AI 自动化流程
convolo-ai-automation
ComposioHQ/awesome-claude-skills
197
指导通过 Composio 的 Rube MCP 自动化 Convolo AI 操作,覆盖工具发现、连接验证、按 schema 执行多工具、会话复用与分页处理,确保运行可靠。
查看详情
Databricks ML模型全生命周期管理
databricks-core-workflow-b
jeremylongshore/claude-code-plugins-plus-skills
121
本流程展示了在Databricks上完整的MLOps生命周期。它指导用户如何使用Feature Store进行特征工程,通过MLflow进行实验跟踪和模型训练,在Model Registry中管理模型版本,最终部署为可实时推理的API服务。适用于构建可生产化、高可靠性的机器学习系统。
查看详情
声明式语言模型系统
dspy
Orchestra-Research/AI-Research-SKILLs
247
DSPy 通过声明式方式构建复杂语言模型系统,组合模块化的 RAG 和智能代理流程,并自动优化提示与模块,提升 LM 应用的可靠性与可维护性。
查看详情
Claude 评估驱动框架
eval-harness
affaan-m/everything-claude-code
90
Claude Code正式评估框架,先定义能力与回归标准,再用代码/模型/人工评估多个阶段,并持续跟踪pass@k和pass^k等可靠性指标以确保交付质量。
查看详情
1
2
3
4
...
6
7
8
下一页
语言
简体中文
English