登录
下载
Skill UI
浏览并发现
7065+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
行为测试
,共找到
2
条记录
默认排序
最新上传
最多下载
大语言模型智能体评估
agent-evaluation
sickn33/antigravity-awesome-skills
361
这是一个用于全面测试和评估大型语言模型(LLM)智能体的框架。它超越了简单的通过/失败判断,深入评估智能体的复杂行为、可靠性指标和能力一致性。适用于生产环境的监控,帮助识别高级AI智能体中的微妙故障模式。
查看详情
人工智能优先工程
ai-first-engineering
affaan-m/everything-claude-code
227
为人工智能辅助代码生成团队提供流程、架构与评审指导,强调高质量规划、可测量覆盖、确定性测试与行为导向评审,保障交付安全可靠。
查看详情
1
语言
简体中文
English