下载

Skill UI

浏览并发现 10192+ 精选技能

全部编程开发人工智能设计创意产品商业数据科学市场营销职场通用效率工具硬件工程语言学习

搜索评估，共找到 268 条记录

默认排序最新上传最多下载

并行代理竞赛平台

alirezarezvani/claude-skills

AgentHub 在独立 git 工作树里并行运行多个智能体，通过指标或 LLM 评估结果，选出最优分支合并，适用于代码优化、内容变体或多策略探索。

宇宙策略评估

evaluating-cosmos-policy

Orchestra-Research/AI-Research-SKILLs

在 LIBERO 或 RoboCasa 仿真中运行 NVIDIA Cosmos Policy 的评估流程，支持无头 EGL GPU 渲染、推理性能分析与标准化基准测试。

OpenPI 微调与推理

fine-tuning-serving-openpi

Orchestra-Research/AI-Research-SKILLs

涵盖 OpenPI pi0 系列模型（pi0、pi0-fast、pi0.5）在机器人操控任务上的微调与推理，提供从配置、数据映射、归一化统计到 JAX/PyTorch 训练、检查点转换以及 WebSocket 策略推理服务的完整流程，适用于 ALOHA、DROID、LIBERO 等评估场景。

合并最佳智能体结果

alirezarezvani/claude-skills

用于将智能体评估（AgentHub）流程中表现最佳的智能体分支合并到主基线分支。此功能实现开发周期的收尾，通过合并获胜分支、使用Git标签归档所有失败智能体提交，并清理工作目录，确保代码库历史记录清晰、安全，完成一次完整的迭代流程。

编码代理性能对比评估

affaan-m/everything-claude-code

本工具是一个轻量级的CLI，用于系统性地对多个编码AI代理（如Claude Code, Aider等）进行“过招”评测。用户通过定义YAML任务，指定代码修改、测试和判断标准，从而量化地获取诸如通过率、API成本、耗时和一致性等关键指标，帮助团队做出基于数据的最佳代理选择。

SBOM供应链漏洞分析

analyzing-sbom-for-supply-chain-vulnerabilities

mukul975/Anthropic-Cybersecurity-Skills

本工具用于解析软件物料清单（SBOM），支持CycloneDX和SPDX格式。它通过与NVD CVE数据库关联组件，识别复杂的供应链漏洞。核心功能包括构建依赖图、计算传递风险得分，并生成合规性报告，适用于安全和合规性评估。

蓝牙低功耗安全评估与攻击检测

detecting-bluetooth-low-energy-attacks

mukul975/Anthropic-Cybersecurity-Skills

本技能用于进行授权的蓝牙低功耗（BLE）安全评估。它系统地指导用户检测和分析各种BLE安全攻击，包括嗅探、中间人攻击、重放攻击和GATT枚举滥用。工作流程涉及使用专业嗅探器进行数据包捕获、通过Python/bleak枚举服务和特征，并使用如crackle等工具进行加密强度分析。

医疗健康安全评估系统

healthcare-eval-harness

affaan-m/everything-claude-code

这是一个为医疗健康应用程序部署设计的自动化验证系统。它通过运行多个强制性测试门（如临床决策支持系统准确性、受保护健康信息泄露检查和数据完整性检查），来强制执行严格的患者安全标准。任何关键门测试的失败都会自动阻止部署，确保在CI/CD流程中达到合规性，保障患者安全。

Laravel插件发现与评估

laravel-plugin-discovery

affaan-m/everything-claude-code

该工具用于发现、审核和评估Laravel插件。用户可以根据关键词搜索，并按健康度（如健康、不健康）筛选，同时验证不同Laravel和PHP版本的兼容性。它帮助开发者选择维护良好、稳定可靠的插件，确保项目质量。

跨栈代码库资产审计

affaan-m/everything-claude-code

repo-scan是一款强大的代码库审计工具，能够对大型、复杂的跨技术栈项目进行全面的资产分析。它能将代码文件分类为项目代码、第三方依赖或构建产物，并识别嵌入的外部库和版本。通过生成交互式HTML报告，为代码的归属权、冗余度提供四级评估（核心资产/提取/重构/废弃），是进行单体仓库重构和架构规划的必备利器。

结果到主张验证门：证据与结论

result-to-claim

wanshuiyin/Auto-claude-code-research-in-sleep

该技能指导研究人员系统性地评估实验结果与预设研究主张的吻合度。它要求用户汇集来自W&B、日志等多个来源的实验数据，首先进行确定性的证据预检查，以排除“幻觉证据”，最后利用Codex进行判断，从而决定结果是支持、不支持还是证据缺失，指导后续的研究方向调整。

云安全态势评估

alirezarezvani/claude-skills

面向 AWS/Azure/GCP 的云安全态势评估，系统化分析 IAM 提权路径、存储公开、网络权限暴露与基础设施即代码配置缺陷，配合 MITRE 映射辅助预防级安全运营。

上一页 1 2 3...13 14 151617 18 19...21 22 23 下一页

语言