登录
下载
Skill UI
浏览并发现
9185+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
基准
,共找到
78
条记录
默认排序
最新上传
最多下载
自动AI智能体进化与优化
evolving-ai-agents
Orchestra-Research/AI-Research-SKILLs
93
A-Evolve是一个通用框架,用于通过LLM驱动的进化算法,自动优化和迭代改进AI智能体。它通过在标准基准测试(Benchmarks)上运行“求解-观察-进化”循环,持续优化智能体的提示词、技能和记忆,实现自学习的、性能增强的智能体。
查看详情
Figma API负载与规模规划
figma-load-scale
jeremylongshore/claude-code-plugins-plus-skills
328
本技能提供了一个全面的框架,用于对Figma API集成进行负载测试和容量规划。它利用k6等工具,帮助用户基准测试API吞吐量,找出速率限制上限,并在高负载下分析延迟。同时,它还提供了请求合并和错峰获取等高级扩展策略,确保应用集成稳定可靠。
查看详情
家庭安防AI基准测试套件
home-security-ai-benchmark
SharpAI/DeepCamera
379
本套件是一个全面的评估工具,用于基准测试大型语言模型(LLM)和视觉语言模型(VLM)在家庭安防领域的性能。它涵盖了143项测试,覆盖了工具使用、提示注入抵抗性、上下文推理、警报分诊和场景分析等16个关键领域,旨在确保智能家居AI系统的稳健性。
查看详情
室内安全隐患检测基准
homesafe-bench
SharpAI/DeepCamera
444
本基准测试用于评估视觉语言模型(VLM)从静态图像中识别室内环境潜在安全隐患的能力。测试覆盖了火灾、电路、跌倒、儿童安全和坠物等五大类别的40个场景,旨在模拟真实世界的固定安防监控,提供VLM实用安全检测能力的严格衡量标准。
查看详情
智能家居视频异常检测基准
smarthome-video-anomaly-benchmark
SharpAI/DeepCamera
102
本基准测试套件专用于评估视觉语言模型(VLM)在智能家居视频异常检测方面的能力。它基于真实的家庭数据集,覆盖了安全入侵、老人跌倒、宠物异常行为等多个生活场景。该测试要求模型进行深度多帧视频理解,是检验AI系统视频理解能力和实时监测准确性的专业级工具。
查看详情
Snowflake工作负载性能与扩容规划
snowflake-load-scale
jeremylongshore/claude-code-plugins-plus-skills
121
本指南提供了一套全面的Snowflake工作负载负载测试和容量规划方法论。内容涵盖了通过调整仓库大小(Scale UP)来优化查询性能,使用多线程模拟高并发用户流量(Scale OUT),以及配置标准、经济、最大化等高级扩容策略。用户可以使用SQL和Python进行性能基准测试,确保数据仓库在生产环境中稳定、高效且成本可控。
查看详情
上一页
1
2
3
4
5
6
7
语言
简体中文
English