下载

Skill UI

浏览并发现 9746+ 精选技能

全部编程开发人工智能设计创意产品商业数据科学市场营销职场通用效率工具硬件工程语言学习

搜索提示评估，共找到 18 条记录

默认排序最新上传最多下载

LLM提示词优化与调试

arize-prompt-optimization

github/awesome-copilot

本技能提供了一个完整的LLM提示词优化、改进和调试框架。它利用生产追踪数据、系统评估和人工标注来提取提示词。用户可以运行数据驱动的优化循环，确保AI的回复达到期望的质量标准。适用于提示词调优、系统提示优化和提升整体AI输出质量。

敏感信息泄露检测

data-leakage-detection

Tencent/AI-Infra-Guard

这是一个用于安全审计的框架，旨在系统性地检测大型语言模型（LLM）是否存在敏感信息泄露。它通过分阶段、递进式的对话探针，测试和捕获包括系统提示词、API密钥、个人身份信息（PII）以及内部配置等多种敏感数据。适用于红队测试和模型安全评估。

家庭安防AI基准测试套件

home-security-ai-benchmark

SharpAI/DeepCamera

本套件是一个全面的评估工具，用于基准测试大型语言模型（LLM）和视觉语言模型（VLM）在家庭安防领域的性能。它涵盖了143项测试，覆盖了工具使用、提示注入抵抗性、上下文推理、警报分诊和场景分析等16个关键领域，旨在确保智能家居AI系统的稳健性。

AI/LLM安全红队测试指南

offensive-ai-security

SnailSploit/Claude-Red

提供一套完整的AI/LLM系统安全渗透测试方法论，用于评估大型语言模型和AI应用的鲁棒性。涵盖提示词注入、越狱、数据投毒、模型提取等高级攻击向量，适用于进行AI系统的红队演练和安全评估。

OWASP智能体安全分类框架

Tencent/AI-Infra-Guard

本技能基于OWASP标准，为智能体应用（Agentic Applications）提供了一套标准化的安全风险分类框架。它能够系统地将发现的各类安全问题，如提示注入、工具滥用、身份权限滥用等，映射到十个核心风险类别（ASI01-ASI10）。这对于安全团队评估、分类和解决复杂AI代理系统中的漏洞至关重要。

提示词与技能优化器

prompt-improver

jeremylongshore/claude-code-plugins-plus-skills

本技能用于全面分析和改进插件提示词、技能定义及命令指令。它从清晰度、安全性、有效性、完整性和简洁性五个维度进行评估，提供详细的评分卡和可操作的重写建议，确保内容符合最佳实践，提升AI性能。

语言