登录
下载
Skill UI
浏览并发现
5115+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
模型评估
,共找到
17
条记录
默认排序
最新上传
最多下载
Vertex 智能体构建器
vertex-agent-builder
jeremylongshore/claude-code-plugins-plus-skills
268
在 Vertex AI 上搭建面向生产环境的生成式智能体,集成 Gemini 模型、多模态处理、RAG、函数调用并可部署到 Cloud Run 或 Vertex Endpoints,提供监控与评估框架,适合企业级应用。
查看详情
PyHealth 医疗 AI 工具包
pyhealth
K-Dense-AI/claude-scientific-skills
202
PyHealth 提供面向电子病历、信号、影像与编码数据的临床预测模型开发、训练、评估与部署能力,包含标准化数据集、任务、模型与解释、校准等模块,适合医疗 AI 场景。
查看详情
高级语言模型评估
advanced-evaluation
sickn33/antigravity-awesome-skills
361
提供生产级语言模型评估方案,涵盖直接打分、成对比较、评分细则、偏差缓解与指标选择,帮助构建自动化评估流程并保持结果可靠。
查看详情
智能体工程流程
agentic-engineering
affaan-m/everything-claude-code
86
指导在 AI 智能体完成实施、人类负责风险与质量把控的工程流程,强调评估优先、任务分解、模型路由及成本与回归监控。
查看详情
Hugging Face 评估管理
hugging-face-evaluation
sickn33/antigravity-awesome-skills
75
该技能在 Hugging Face 模型卡中添加结构化评估数据,支持从 README 表格提取、从 Artificial Analysis 导入基准分数,并借助 vLLM/lighteval 运行自定义评估,自动生成 model-index 格式元数据并可通过 Jobs 或 PR 提交更新。
查看详情
上一页
1
2
语言
简体中文
English