下载

Skill UI

浏览并发现 9688+ 精选技能

全部编程开发人工智能设计创意产品商业数据科学市场营销职场通用效率工具硬件工程语言学习

搜索 A/B测试，共找到 52 条记录

默认排序最新上传最多下载

配置Fathom AI API认证

fathom-install-auth

jeremylongshore/claude-code-plugins-plus-skills

本技能提供了一份关于配置Fathom AI API访问权限的详细指南。它指导用户如何生成API密钥、设置环境配置，并测试API连接，从而确保能够成功调用Fathom的API，获取会议记录、摘要和行动项等关键会议数据。

Abridge医疗AI持续集成

abridge-ci-integration

jeremylongshore/claude-code-plugins-plus-skills

用于为Abridge临床AI集成构建完整的CI/CD流程。该流程通过GitHub Actions自动化执行，重点包括FHIR资源格式验证、PHI泄露扫描（确保HIPAA合规性）以及沙箱环境的端到端集成测试。确保医疗AI应用的安全性与可靠性。

Abridge环境AI临床文档生成

abridge-hello-world

jeremylongshore/claude-code-plugins-plus-skills

本示例提供了一个最小化的工作模型，展示了Abridge环境下的AI临床文档自动化流程。用户可以通过模拟一次完整的诊疗会话，提交对话记录，系统将自动生成高度结构化的临床病历（包括主诉、病史、评估等），并提取相关的ICD/CPT编码，适用于测试医疗信息系统集成和AI数据结构化能力。

AI安全扫描与漏洞检测

Tencent/AI-Infra-Guard

本工具依托红心实验室的AI-Infra-Guard框架，提供全方位的AI安全扫描服务。可对AI基础设施、工具、技能、Agent以及大型语言模型进行深度安全审计和漏洞检测，包括越狱测试，确保AI系统的安全性和可靠性。

自动AI智能体进化与优化

evolving-ai-agents

Orchestra-Research/AI-Research-SKILLs

A-Evolve是一个通用框架，用于通过LLM驱动的进化算法，自动优化和迭代改进AI智能体。它通过在标准基准测试（Benchmarks）上运行“求解-观察-进化”循环，持续优化智能体的提示词、技能和记忆，实现自学习的、性能增强的智能体。

家庭安防AI基准测试套件

home-security-ai-benchmark

SharpAI/DeepCamera

本套件是一个全面的评估工具，用于基准测试大型语言模型（LLM）和视觉语言模型（VLM）在家庭安防领域的性能。它涵盖了143项测试，覆盖了工具使用、提示注入抵抗性、上下文推理、警报分诊和场景分析等16个关键领域，旨在确保智能家居AI系统的稳健性。

室内安全隐患检测基准

SharpAI/DeepCamera

本基准测试用于评估视觉语言模型（VLM）从静态图像中识别室内环境潜在安全隐患的能力。测试覆盖了火灾、电路、跌倒、儿童安全和坠物等五大类别的40个场景，旨在模拟真实世界的固定安防监控，提供VLM实用安全检测能力的严格衡量标准。

大模型链评估与回归测试

langchain-eval-harness

jeremylongshore/claude-code-plugins-plus-skills

本工具提供了一套全面的、可复现的LLM链和智能体评估系统。它集成了黄金数据集管理、LangSmith评估、RAGAS指标、deepeval LLM判别等功能。适用于为新构建的链条设置质量基线、诊断模型切换后的性能退化，以及在CI/CD流程中设置回归检测门禁。

LangChain提示工程与版本控制

langchain-prompt-engineering

jeremylongshore/claude-code-plugins-plus-skills

本技能为LangChain应用提供了专业的提示工程解决方案。它解决了代码中嵌入式提示字符串易出错的问题，指导开发者将提示集中化并版本化。核心功能包括利用LangSmith平台进行提示的发布、回滚和A/B测试，通过固定的Commit Hash实现生产环境的稳定版本锁定，确保LLM应用的提示层可靠性。

AI/LLM安全红队测试指南

offensive-ai-security

SnailSploit/Claude-Red

提供一套完整的AI/LLM系统安全渗透测试方法论，用于评估大型语言模型和AI应用的鲁棒性。涵盖提示词注入、越狱、数据投毒、模型提取等高级攻击向量，适用于进行AI系统的红队演练和安全评估。

智能体技能全周期创建与优化

skill-creator-pro

libukai/awesome-agent-skills

本技能提供了一个完整的、结构化的流程，指导用户从零开始创建、改进和优化任何领域的AI智能体技能。它涵盖了从概念理解、设计架构、编写代码到执行严格测试和性能优化的全部阶段，确保生成的技能逻辑严谨、触发准确且实用。

智能家居视频异常检测基准

smarthome-video-anomaly-benchmark

SharpAI/DeepCamera

本基准测试套件专用于评估视觉语言模型（VLM）在智能家居视频异常检测方面的能力。它基于真实的家庭数据集，覆盖了安全入侵、老人跌倒、宠物异常行为等多个生活场景。该测试要求模型进行深度多帧视频理解，是检验AI系统视频理解能力和实时监测准确性的专业级工具。

上一页 1 2 345 下一页

语言