登录
下载
Skill UI
浏览并发现
10192+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
评估
,共找到
268
条记录
默认排序
最新上传
最多下载
并行代理竞赛平台
agenthub
alirezarezvani/claude-skills
469
AgentHub 在独立 git 工作树里并行运行多个智能体,通过指标或 LLM 评估结果,选出最优分支合并,适用于代码优化、内容变体或多策略探索。
查看详情
宇宙策略评估
evaluating-cosmos-policy
Orchestra-Research/AI-Research-SKILLs
493
在 LIBERO 或 RoboCasa 仿真中运行 NVIDIA Cosmos Policy 的评估流程,支持无头 EGL GPU 渲染、推理性能分析与标准化基准测试。
查看详情
OpenPI 微调与推理
fine-tuning-serving-openpi
Orchestra-Research/AI-Research-SKILLs
78
涵盖 OpenPI pi0 系列模型(pi0、pi0-fast、pi0.5)在机器人操控任务上的微调与推理,提供从配置、数据映射、归一化统计到 JAX/PyTorch 训练、检查点转换以及 WebSocket 策略推理服务的完整流程,适用于 ALOHA、DROID、LIBERO 等评估场景。
查看详情
合并最佳智能体结果
merge
alirezarezvani/claude-skills
312
用于将智能体评估(AgentHub)流程中表现最佳的智能体分支合并到主基线分支。此功能实现开发周期的收尾,通过合并获胜分支、使用Git标签归档所有失败智能体提交,并清理工作目录,确保代码库历史记录清晰、安全,完成一次完整的迭代流程。
查看详情
编码代理性能对比评估
agent-eval
affaan-m/everything-claude-code
430
本工具是一个轻量级的CLI,用于系统性地对多个编码AI代理(如Claude Code, Aider等)进行“过招”评测。用户通过定义YAML任务,指定代码修改、测试和判断标准,从而量化地获取诸如通过率、API成本、耗时和一致性等关键指标,帮助团队做出基于数据的最佳代理选择。
查看详情
SBOM供应链漏洞分析
analyzing-sbom-for-supply-chain-vulnerabilities
mukul975/Anthropic-Cybersecurity-Skills
378
本工具用于解析软件物料清单(SBOM),支持CycloneDX和SPDX格式。它通过与NVD CVE数据库关联组件,识别复杂的供应链漏洞。核心功能包括构建依赖图、计算传递风险得分,并生成合规性报告,适用于安全和合规性评估。
查看详情
蓝牙低功耗安全评估与攻击检测
detecting-bluetooth-low-energy-attacks
mukul975/Anthropic-Cybersecurity-Skills
236
本技能用于进行授权的蓝牙低功耗(BLE)安全评估。它系统地指导用户检测和分析各种BLE安全攻击,包括嗅探、中间人攻击、重放攻击和GATT枚举滥用。工作流程涉及使用专业嗅探器进行数据包捕获、通过Python/bleak枚举服务和特征,并使用如crackle等工具进行加密强度分析。
查看详情
医疗健康安全评估系统
healthcare-eval-harness
affaan-m/everything-claude-code
190
这是一个为医疗健康应用程序部署设计的自动化验证系统。它通过运行多个强制性测试门(如临床决策支持系统准确性、受保护健康信息泄露检查和数据完整性检查),来强制执行严格的患者安全标准。任何关键门测试的失败都会自动阻止部署,确保在CI/CD流程中达到合规性,保障患者安全。
查看详情
Laravel插件发现与评估
laravel-plugin-discovery
affaan-m/everything-claude-code
481
该工具用于发现、审核和评估Laravel插件。用户可以根据关键词搜索,并按健康度(如健康、不健康)筛选,同时验证不同Laravel和PHP版本的兼容性。它帮助开发者选择维护良好、稳定可靠的插件,确保项目质量。
查看详情
跨栈代码库资产审计
repo-scan
affaan-m/everything-claude-code
351
repo-scan是一款强大的代码库审计工具,能够对大型、复杂的跨技术栈项目进行全面的资产分析。它能将代码文件分类为项目代码、第三方依赖或构建产物,并识别嵌入的外部库和版本。通过生成交互式HTML报告,为代码的归属权、冗余度提供四级评估(核心资产/提取/重构/废弃),是进行单体仓库重构和架构规划的必备利器。
查看详情
结果到主张验证门:证据与结论
result-to-claim
wanshuiyin/Auto-claude-code-research-in-sleep
71
该技能指导研究人员系统性地评估实验结果与预设研究主张的吻合度。它要求用户汇集来自W&B、日志等多个来源的实验数据,首先进行确定性的证据预检查,以排除“幻觉证据”,最后利用Codex进行判断,从而决定结果是支持、不支持还是证据缺失,指导后续的研究方向调整。
查看详情
云安全态势评估
cloud-security
alirezarezvani/claude-skills
470
面向 AWS/Azure/GCP 的云安全态势评估,系统化分析 IAM 提权路径、存储公开、网络权限暴露与基础设施即代码配置缺陷,配合 MITRE 映射辅助预防级安全运营。
查看详情
上一页
1
2
3
...
13
14
15
16
17
18
19
...
21
22
23
下一页
语言
简体中文
English