登录
下载
Skill UI
浏览并发现
6581+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
工具质量
,共找到
4
条记录
默认排序
最新上传
最多下载
LLM 评估工具套件
evaluating-llms-harness
Orchestra-Research/AI-Research-SKILLs
344
通过 lm-evaluation-harness 在 MMLU、HumanEval、GSM8K 等 60 多个学术基准上,对 HuggingFace/vLLM/API 模型进行对比评测、训练追踪并输出统一报告,适合实验室发布与质量监控。
查看详情
LLM评估工具集
llm-evaluation
sickn33/antigravity-awesome-skills
205
指导通过自动化指标、人工评估及大模型裁判策略,衡量提示、监控回归、验证生产部署质量。
查看详情
智能体工具设计原则
tool-design
sickn33/antigravity-awesome-skills
138
指导如何为智能体构建清晰契约的工具API,包括描述、错误提示与示例,强调工作流合并与架构简化,提升代理选择与使用工具的质量。
查看详情
提示治理工具包
prompt-governance
alirezarezvani/claude-skills
278
将提示视为生产级代码,提供注册中心、评估流水线和治理流程,帮助团队管理版本、测试质量、推进上线并防止回归。
查看详情
1
语言
简体中文
English