登录
下载
Skill UI
浏览并发现
6034+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
LLM测试
,共找到
4
条记录
默认排序
最新上传
最多下载
LLM 代理评估
agent-evaluation
sickn33/antigravity-awesome-skills
97
基于行为合约、统计分布和对抗测试的 LLM 代理评估,发现基准未暴露的生产风险,聚焦可靠性与能力。
查看详情
Langfuse评估与打分流程
langfuse-core-workflow-b
jeremylongshore/claude-code-plugins-plus-skills
400
使用Langfuse核心流程B收集用户反馈、自动化评估函数、LLM裁判评分,并对比提示以实现AI产出质量打分和AB测试。
查看详情
LangSmith LLM 观测平台
langsmith-observability
Orchestra-Research/AI-Research-SKILLs
168
LangSmith 是用于调试、评估与监控 LLM 应用的观测平台,可追踪调用、构建评测数据集、监控生产指标与成本,助力回归测试与运维协作。
查看详情
类型安全的AI代理
pydantic-ai
sickn33/antigravity-awesome-skills
344
PydanticAI 将 Pydantic 的类型校验带到 LLM 代理中,通过结构化输出、依赖注入与多模型接入,让 Python 团队在构建、测试和复用智能客服或流程机器人时保持正确性与可测性。
查看详情
1
语言
简体中文
English