下载

Skill UI

浏览并发现 5115+ 精选技能

全部编程开发人工智能设计创意产品商业数据科学市场营销职场通用效率工具硬件工程语言学习

搜索模型评估，共找到 17 条记录

默认排序最新上传最多下载

Vertex 智能体构建器

vertex-agent-builder

jeremylongshore/claude-code-plugins-plus-skills

在 Vertex AI 上搭建面向生产环境的生成式智能体，集成 Gemini 模型、多模态处理、RAG、函数调用并可部署到 Cloud Run 或 Vertex Endpoints，提供监控与评估框架，适合企业级应用。

PyHealth 医疗 AI 工具包

K-Dense-AI/claude-scientific-skills

PyHealth 提供面向电子病历、信号、影像与编码数据的临床预测模型开发、训练、评估与部署能力，包含标准化数据集、任务、模型与解释、校准等模块，适合医疗 AI 场景。

高级语言模型评估

advanced-evaluation

sickn33/antigravity-awesome-skills

提供生产级语言模型评估方案，涵盖直接打分、成对比较、评分细则、偏差缓解与指标选择，帮助构建自动化评估流程并保持结果可靠。

智能体工程流程

agentic-engineering

affaan-m/everything-claude-code

指导在 AI 智能体完成实施、人类负责风险与质量把控的工程流程，强调评估优先、任务分解、模型路由及成本与回归监控。

Hugging Face 评估管理

hugging-face-evaluation

sickn33/antigravity-awesome-skills

该技能在 Hugging Face 模型卡中添加结构化评估数据，支持从 README 表格提取、从 Artificial Analysis 导入基准分数，并借助 vLLM/lighteval 运行自定义评估，自动生成 model-index 格式元数据并可通过 Jobs 或 PR 提交更新。

语言