登录
下载
Skill UI
浏览并发现
5146+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
基准
,共找到
8
条记录
默认排序
最新上传
最多下载
自治AI代理平台
autogpt-agents
Orchestra-Research/AI-Research-SKILLs
140
AutoGPT 是一个自治 AI 代理平台,通过可视化构建、触发器、集成以及基准工具,帮助团队创建并部署持续运行的多步骤自动化代理。
查看详情
自治AI代理平台
autogpt-agents
Orchestra-Research/AI-Research-SKILLs
140
AutoGPT 是一个自治 AI 代理平台,通过可视化构建、触发器、集成以及基准工具,帮助团队创建并部署持续运行的多步骤自动化代理。
查看详情
LLM 评估工具套件
evaluating-llms-harness
Orchestra-Research/AI-Research-SKILLs
343
通过 lm-evaluation-harness 在 MMLU、HumanEval、GSM8K 等 60 多个学术基准上,对 HuggingFace/vLLM/API 模型进行对比评测、训练追踪并输出统一报告,适合实验室发布与质量监控。
查看详情
KlingAI 性能调优
klingai-performance-tuning
jeremylongshore/claude-code-plugins-plus-skills
370
通过基准测试、识别瓶颈、部署优化、再测比对等流程提升 Kling AI 的速度、质量与成本效率,帮助用户在实践中取得平衡的性能提升。
查看详情
Klingai 视频延长
klingai-video-extension
jeremylongshore/claude-code-plugins-plus-skills
197
通过 Kling AI 的续接能力将短视频延展为连贯的长片,设置基准片段、续接参数并合并生成段落,便于制作无缝循环或剧情衔接。
查看详情
NeMo LLM 企业级评测
nemo-evaluator-sdk
Orchestra-Research/AI-Research-SKILLs
345
NeMo Evaluator SDK 提供企业级 LLM 评测,基于容器化、多后端(Docker、本地 Slurm、云端)执行,覆盖 100+ 基准和 18+ 工具链,便于复现、对比和监控模型表现。
查看详情
基因组区间机器学习
geniml
K-Dense-AI/claude-scientific-skills
363
Geniml 是一个针对 BED 和 scATAC-seq 区间数据的机器学习工具包,提供区域与元数据嵌入、基准宇宙构建、缓存与评估等工具,支持相似性搜索、聚类和下游分析。
查看详情
Hugging Face 评估管理
hugging-face-evaluation
sickn33/antigravity-awesome-skills
75
该技能在 Hugging Face 模型卡中添加结构化评估数据,支持从 README 表格提取、从 Artificial Analysis 导入基准分数,并借助 vLLM/lighteval 运行自定义评估,自动生成 model-index 格式元数据并可通过 Jobs 或 PR 提交更新。
查看详情
1
语言
简体中文
English