下载

Skill UI

浏览并发现 9688+ 精选技能

全部编程开发人工智能设计创意产品商业数据科学市场营销职场通用效率工具硬件工程语言学习

搜索质量评估，共找到 17 条记录

默认排序最新上传最多下载

提示治理工具包

prompt-governance

alirezarezvani/claude-skills

将提示视为生产级代码，提供注册中心、评估流水线和治理流程，帮助团队管理版本、测试质量、推进上线并防止回归。

智能体评估与迭代优化模式

github/awesome-copilot

本技能提供了一套完整的AI智能体（Agent）评估和迭代优化模式。它指导用户构建自我批判、评估器-优化器等复杂流程，用于提高代码、报告和分析等复杂内容的准确性和质量。通过实现结构化的迭代循环，实现持续的输出改进（生成→评估→批判→优化）。

LLM提示词优化与调试

arize-prompt-optimization

github/awesome-copilot

本技能提供了一个完整的LLM提示词优化、改进和调试框架。它利用生产追踪数据、系统评估和人工标注来提取提示词。用户可以运行数据驱动的优化循环，确保AI的回复达到期望的质量标准。适用于提示词调优、系统提示优化和提升整体AI输出质量。

科学批判性思维

scientific-critical-thinking

K-Dense-AI/scientific-agent-skills

评估科研结论和实验严谨性，根据方法学、统计有效性、证据质量与偏差，结合 GRADE 与 Cochrane 风险评估框架，必要时配套科学图示，提升分析清晰度。

大模型链评估与回归测试

langchain-eval-harness

jeremylongshore/claude-code-plugins-plus-skills

本工具提供了一套全面的、可复现的LLM链和智能体评估系统。它集成了黄金数据集管理、LangSmith评估、RAGAS指标、deepeval LLM判别等功能。适用于为新构建的链条设置质量基线、诊断模型切换后的性能退化，以及在CI/CD流程中设置回归检测门禁。

语言