登录
下载
Skill UI
浏览并发现
9688+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
质量评估
,共找到
17
条记录
默认排序
最新上传
最多下载
提示治理工具包
prompt-governance
alirezarezvani/claude-skills
278
将提示视为生产级代码,提供注册中心、评估流水线和治理流程,帮助团队管理版本、测试质量、推进上线并防止回归。
查看详情
智能体评估与迭代优化模式
agentic-eval
github/awesome-copilot
305
本技能提供了一套完整的AI智能体(Agent)评估和迭代优化模式。它指导用户构建自我批判、评估器-优化器等复杂流程,用于提高代码、报告和分析等复杂内容的准确性和质量。通过实现结构化的迭代循环,实现持续的输出改进(生成→评估→批判→优化)。
查看详情
LLM提示词优化与调试
arize-prompt-optimization
github/awesome-copilot
273
本技能提供了一个完整的LLM提示词优化、改进和调试框架。它利用生产追踪数据、系统评估和人工标注来提取提示词。用户可以运行数据驱动的优化循环,确保AI的回复达到期望的质量标准。适用于提示词调优、系统提示优化和提升整体AI输出质量。
查看详情
科学批判性思维
scientific-critical-thinking
K-Dense-AI/scientific-agent-skills
178
评估科研结论和实验严谨性,根据方法学、统计有效性、证据质量与偏差,结合 GRADE 与 Cochrane 风险评估框架,必要时配套科学图示,提升分析清晰度。
查看详情
大模型链评估与回归测试
langchain-eval-harness
jeremylongshore/claude-code-plugins-plus-skills
103
本工具提供了一套全面的、可复现的LLM链和智能体评估系统。它集成了黄金数据集管理、LangSmith评估、RAGAS指标、deepeval LLM判别等功能。适用于为新构建的链条设置质量基线、诊断模型切换后的性能退化,以及在CI/CD流程中设置回归检测门禁。
查看详情
上一页
1
2
语言
简体中文
English