登录
下载
Skill UI
浏览并发现
6034+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
持续验证
,共找到
3
条记录
默认排序
最新上传
最多下载
评估流程框架
eval-harness
affaan-m/everything-claude-code
428
Claude Code 的正式评估框架,将评价驱动开发落地,通过能力与回归评估、代码/模型/人类评价者及 pass@k 指标,实现迭代中的持续验证与报告。
查看详情
智能体评估框架
evaluation
sickn33/antigravity-awesome-skills
373
构建符合多维指标的智能体评估体系,衡量令牌使用、工具调用和模型选择,验证上下文工程、捕捉回归并持续监控生产能力。
查看详情
Langfuse 持续集成配置
langfuse-ci-integration
jeremylongshore/claude-code-plugins-plus-skills
163
在 GitHub Actions 中配置 Langfuse,可实现轨迹验证、提示回归测试、提示自动部署与质量分数监控,帮助持续集成阶段验证和管理提示与调用质量。
查看详情
1
语言
简体中文
English