登录
下载
Skill UI
浏览并发现
9688+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
基准
,共找到
79
条记录
默认排序
最新上传
最多下载
本地Hugging Face模型评估
hugging-face-community-evals
sickn33/antigravity-awesome-skills
359
本技能用于在本地硬件上对Hugging Face Hub上的大模型进行专业的评估和基准测试。它支持使用`inspect-ai`和`lighteval`等评估框架,帮助用户选择最佳推理后端(如`vllm`、Transformers或`accelerate`),进行全面的烟雾测试和任务选择。该技能专注于本地执行流程,不负责远程作业编排或结果发布。
查看详情
Go性能基准测试与分析
golang-benchmark
samber/cc-skills-golang
163
本技能系统地指导Go语言的性能测量工作流。涵盖编写高质量基准测试、运行统计学意义的测试,以及生成CPU、内存和执行追踪等详细性能档案。通过专业的对比分析,确保所有的优化决策都基于严谨的数据,有效防止性能回归。
查看详情
Go性能优化方法论
golang-performance
samber/cc-skills-golang
291
这是一份全面的Go应用性能优化方法论指南。它指导工程师系统地识别和解决性能瓶颈,涵盖CPU使用率、内存分配、I/O延迟和算法复杂度等多个维度。核心原则是“先测量,再优化”,强调通过迭代基准测试和结构化流程进行改进。
查看详情
AI技能创建与迭代优化
skill-creator
CherryHQ/cherry-studio
213
提供一套完整的AI技能生命周期管理流程。用户可以使用此工具从零开始创建新的AI技能,修改或优化现有技能,并通过运行评估和基准测试来持续提升性能,确保技能的稳定性和触发准确性。
查看详情
Go测试最佳实践指南
golang-testing
samber/cc-skills-golang
214
全面的 Go 测试指南,涵盖表格驱动子测试、testify 套件、mock、单元/集成测试、基准测试、覆盖率、fuzz、goleak 泄漏检测、快照、以及 GitHub Actions CI,确保测试可靠。
查看详情
Arize实验评估与管理
arize-experiment
github/awesome-copilot
327
本技能提供了一套完整的Arize实验管理工具,用于AI模型性能的评估、比较和分析。用户可以使用它来创建、列出、获取和导出实验结果,支持进行模型基准测试和A/B测试,确保模型在特定数据集上的准确性。
查看详情
数据库迁移缺陷报告撰写指南
creating-oracle-to-postgres-migration-bug-report
github/awesome-copilot
222
本文档提供了在执行Oracle到PostgreSQL数据库迁移时,撰写结构化缺陷报告的完整指南。它详细介绍了缺陷报告必须包含的要素,包括缺陷严重性、根因分析、复现场景和解决方案。核心指导原则是以上游的Oracle行为为基准,确保记录全面准确,从而提升缺陷追踪和修复的效率。
查看详情
LLM应用评估驱动开发
eval-driven-dev
github/awesome-copilot
418
本技能指导用户为基于大型语言模型(LLM)的Python应用搭建自动化评估流水线。核心流程包括定义评估标准、仪器化应用、构建黄金数据集和运行真实评估。它专注于测试应用自身的逻辑和流程,确保LLM应用的质量和鲁棒性,适用于QA、基准测试和提升LLM服务质量。
查看详情
Pymoo 多目标优化框架
pymoo
K-Dense-AI/scientific-agent-skills
414
Python 框架,集成 NSGA-II/III、MOEA/D 等多目标与约束优化算法,支持基准问题、定制算子与帕累托前沿可视化,适合工程设计与多方案决策。
查看详情
Adobe API负载与弹性扩展测试
adobe-load-scale
jeremylongshore/claude-code-plugins-plus-skills
167
本指南提供了一套完整的解决方案,用于对Adobe API(如Firefly、PDF服务)进行负载测试、性能基准测试和弹性伸缩配置。它使用k6模拟真实高并发流量,并通过Kubernetes HPA配置,确保您的应用在峰值负载下也能保持高可用性和稳定性。
查看详情
Claude API 负载测试与容量规划
anth-load-scale
jeremylongshore/claude-code-plugins-plus-skills
462
本指南提供了一套用于进行Claude API负载测试和容量规划的工具与方法。它帮助开发者进行性能基准测试,预测流量高峰,管理速率限制(RPM/ITPM/OTPM),并指导如何使用Python实现健壮的水平扩展架构,确保AI服务在高并发场景下的稳定性。
查看详情
CoreWeave GPU工作负载部署
coreweave-hello-world
jeremylongshore/claude-code-plugins-plus-skills
436
本指南提供在CoreWeave平台上使用Kubernetes(kubectl)部署GPU工作负载的教程。内容包括部署vLLM服务进行大型语言模型(LLM)推理测试,以及运行CUDA批量作业进行性能基准测试。适用于首次部署GPU任务或验证集群访问的场景。
查看详情
上一页
1
2
3
4
5
6
7
下一页
语言
简体中文
English