登录
下载
Skill UI
浏览并发现
7513+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
质量评估
,共找到
37
条记录
默认排序
最新上传
最多下载
API设计规范审查器
api-design-reviewer
alirezarezvani/claude-skills
319
本技能旨在提供全面的API设计审核功能,确保API符合RESTful的最佳实践和行业标准。它能够自动执行代码规范检查、检测破坏性变更(如字段删除、类型修改),评估版本控制、分页模式和安全实现,帮助工程团队构建稳定、一致、高质量的API接口。
查看详情
Claude 评估驱动框架
eval-harness
affaan-m/everything-claude-code
90
Claude Code正式评估框架,先定义能力与回归标准,再用代码/模型/人工评估多个阶段,并持续跟踪pass@k和pass^k等可靠性指标以确保交付质量。
查看详情
代码模型评估与基准测试
evaluating-code-models
Orchestra-Research/AI-Research-SKILLs
200
本工具箱用于全面评估代码生成模型的性能。它支持针对HumanEval、MBPP、MultiPL-E等行业标准进行多语言基准测试。可量化比较不同大型语言模型(LLM)的编码能力,通过pass@k指标衡量代码生成质量。
查看详情
Langfuse 观测平台
langfuse
sickn33/antigravity-awesome-skills
134
Langfuse 提供完整的 LLM 观测能力,涵盖调用追踪、提示管理、评估打分与成本/延迟/质量监控,适用于与 LangChain、LlamaIndex、OpenAI 等集成的生产场景。
查看详情
Langfuse评估与打分流程
langfuse-core-workflow-b
jeremylongshore/claude-code-plugins-plus-skills
400
使用Langfuse核心流程B收集用户反馈、自动化评估函数、LLM裁判评分,并对比提示以实现AI产出质量打分和AB测试。
查看详情
LangSmith LLM 可观测平台
langsmith-observability
Orchestra-Research/AI-Research-SKILLs
142
LangSmith 为 LLM 应用提供端到端观测能力,跟踪调用、评估输出、监控生产系统并构建测试集,同时与 OpenAI、Anthropic、LangChain 等集成,方便排查问题与保障服务质量。
查看详情
Lindy 迁移深度解析
lindy-migration-deep-dive
jeremylongshore/claude-code-plugins-plus-skills
181
为团队提供 Lindy AI 集成迁移流程,从评估范围、合并代理、分阶段部署到数据转换与回滚验证,附带清单确保上线前的多环境准备与质量保障。
查看详情
多智能体代码审查编排工具
performance-testing-review-multi-agent-review
sickn33/antigravity-awesome-skills
109
该工具是一个复杂的AI代码审查系统,能够协调多个专业化的智能体(如安全、架构、性能等)。它超越了传统单一视角的审查限制,通过管理上下文、执行混合工作流、解决冲突和综合分析,为代码提供全面、深度的多视角评估和可执行的质量报告。
查看详情
变异测试质量评估
running-mutation-tests
jeremylongshore/claude-code-plugins-plus-skills
356
在用户请求评估或提升测试有效性时,自动插入变异、重跑测试并上报存活变体和变异分数,帮助识别测试盲点并加强代码质量。
查看详情
高级提示词工程指南
senior-prompt-engineer
alirezarezvani/claude-skills
260
为提示词工程师准备的工具集,涵盖提示优化、LLM评估、RAG 质量检测、少样本示例整理及智能体工作流可视化与验证,助力构建可靠的代理系统。
查看详情
SEO核心原理
seo-fundamentals
sickn33/antigravity-awesome-skills
111
介绍保障可持续搜索可见性的核心原理,涵盖E-E-A-T评估、页面体验指标、技术SEO、结构化数据以及AI辅助内容的质量与风险控制。
查看详情
科学数据探索分析
exploratory-data-analysis
K-Dense-AI/claude-scientific-skills
414
自动识别 200+ 科学数据格式,提取元数据、评估数据质量、推荐可视化方案,并生成 Markdown 报告,帮助科研人员在后续分析前全面把握数据结构与特征。
查看详情
1
2
3
4
下一页
语言
简体中文
English