登录
下载
Skill UI
浏览并发现
9688+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
基准测试
,共找到
56
条记录
默认排序
最新上传
最多下载
多平台竞品情报分析
apify-competitor-intelligence
sickn33/antigravity-awesome-skills
409
该工具提供全面的竞品情报分析,能够从谷歌地图、预订网站、脸书、Instagram、YouTube和TikTok等多个主流平台采集和分析数据。它可以提取竞争对手的内容、定价、广告策略、评论情绪和市场定位等结构化数据。适用于需要进行深度市场基准测试、制定产品或营销战略的研究人员和专业人员。
查看详情
机器人课题探索全流程
idea-discovery-robot
wanshuiyin/Auto-claude-code-research-in-sleep
236
这是一个专业的机器人想法发现工作流,包含文献调研、新颖性检查和批判性回顾等多个阶段。它帮助用户将一个宽泛的机器人方向,系统性地转化为具备可验证性、可仿真化和明确基准测试的创新项目点子,适用于前沿课题研究和项目孵化。
查看详情
宇宙策略评估
evaluating-cosmos-policy
Orchestra-Research/AI-Research-SKILLs
493
在 LIBERO 或 RoboCasa 仿真中运行 NVIDIA Cosmos Policy 的评估流程,支持无头 EGL GPU 渲染、推理性能分析与标准化基准测试。
查看详情
性能基准测试与回归检测
benchmark
affaan-m/everything-claude-code
242
该工具用于建立多维度的性能基准线。它能够测量核心网页指标(如LCP、CLS、INP)、API延迟(p50、p95、p99)以及开发构建效率。在代码合并前,用于检测性能回归,确保持续集成/持续部署流程的稳定性,并对比不同的技术栈替代方案。
查看详情
本地Hugging Face模型评估
hugging-face-community-evals
sickn33/antigravity-awesome-skills
359
本技能用于在本地硬件上对Hugging Face Hub上的大模型进行专业的评估和基准测试。它支持使用`inspect-ai`和`lighteval`等评估框架,帮助用户选择最佳推理后端(如`vllm`、Transformers或`accelerate`),进行全面的烟雾测试和任务选择。该技能专注于本地执行流程,不负责远程作业编排或结果发布。
查看详情
Go性能基准测试与分析
golang-benchmark
samber/cc-skills-golang
163
本技能系统地指导Go语言的性能测量工作流。涵盖编写高质量基准测试、运行统计学意义的测试,以及生成CPU、内存和执行追踪等详细性能档案。通过专业的对比分析,确保所有的优化决策都基于严谨的数据,有效防止性能回归。
查看详情
Go性能优化方法论
golang-performance
samber/cc-skills-golang
291
这是一份全面的Go应用性能优化方法论指南。它指导工程师系统地识别和解决性能瓶颈,涵盖CPU使用率、内存分配、I/O延迟和算法复杂度等多个维度。核心原则是“先测量,再优化”,强调通过迭代基准测试和结构化流程进行改进。
查看详情
AI技能创建与迭代优化
skill-creator
CherryHQ/cherry-studio
213
提供一套完整的AI技能生命周期管理流程。用户可以使用此工具从零开始创建新的AI技能,修改或优化现有技能,并通过运行评估和基准测试来持续提升性能,确保技能的稳定性和触发准确性。
查看详情
Go测试最佳实践指南
golang-testing
samber/cc-skills-golang
214
全面的 Go 测试指南,涵盖表格驱动子测试、testify 套件、mock、单元/集成测试、基准测试、覆盖率、fuzz、goleak 泄漏检测、快照、以及 GitHub Actions CI,确保测试可靠。
查看详情
Arize实验评估与管理
arize-experiment
github/awesome-copilot
327
本技能提供了一套完整的Arize实验管理工具,用于AI模型性能的评估、比较和分析。用户可以使用它来创建、列出、获取和导出实验结果,支持进行模型基准测试和A/B测试,确保模型在特定数据集上的准确性。
查看详情
LLM应用评估驱动开发
eval-driven-dev
github/awesome-copilot
418
本技能指导用户为基于大型语言模型(LLM)的Python应用搭建自动化评估流水线。核心流程包括定义评估标准、仪器化应用、构建黄金数据集和运行真实评估。它专注于测试应用自身的逻辑和流程,确保LLM应用的质量和鲁棒性,适用于QA、基准测试和提升LLM服务质量。
查看详情
Adobe API负载与弹性扩展测试
adobe-load-scale
jeremylongshore/claude-code-plugins-plus-skills
167
本指南提供了一套完整的解决方案,用于对Adobe API(如Firefly、PDF服务)进行负载测试、性能基准测试和弹性伸缩配置。它使用k6模拟真实高并发流量,并通过Kubernetes HPA配置,确保您的应用在峰值负载下也能保持高可用性和稳定性。
查看详情
上一页
1
2
3
4
5
下一页
语言
简体中文
English