登录
下载
Skill UI
浏览并发现
9746+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
提示评估
,共找到
18
条记录
默认排序
最新上传
最多下载
LLM提示词优化与调试
arize-prompt-optimization
github/awesome-copilot
273
本技能提供了一个完整的LLM提示词优化、改进和调试框架。它利用生产追踪数据、系统评估和人工标注来提取提示词。用户可以运行数据驱动的优化循环,确保AI的回复达到期望的质量标准。适用于提示词调优、系统提示优化和提升整体AI输出质量。
查看详情
敏感信息泄露检测
data-leakage-detection
Tencent/AI-Infra-Guard
58
这是一个用于安全审计的框架,旨在系统性地检测大型语言模型(LLM)是否存在敏感信息泄露。它通过分阶段、递进式的对话探针,测试和捕获包括系统提示词、API密钥、个人身份信息(PII)以及内部配置等多种敏感数据。适用于红队测试和模型安全评估。
查看详情
家庭安防AI基准测试套件
home-security-ai-benchmark
SharpAI/DeepCamera
379
本套件是一个全面的评估工具,用于基准测试大型语言模型(LLM)和视觉语言模型(VLM)在家庭安防领域的性能。它涵盖了143项测试,覆盖了工具使用、提示注入抵抗性、上下文推理、警报分诊和场景分析等16个关键领域,旨在确保智能家居AI系统的稳健性。
查看详情
AI/LLM安全红队测试指南
offensive-ai-security
SnailSploit/Claude-Red
479
提供一套完整的AI/LLM系统安全渗透测试方法论,用于评估大型语言模型和AI应用的鲁棒性。涵盖提示词注入、越狱、数据投毒、模型提取等高级攻击向量,适用于进行AI系统的红队演练和安全评估。
查看详情
OWASP智能体安全分类框架
owasp-asi
Tencent/AI-Infra-Guard
218
本技能基于OWASP标准,为智能体应用(Agentic Applications)提供了一套标准化的安全风险分类框架。它能够系统地将发现的各类安全问题,如提示注入、工具滥用、身份权限滥用等,映射到十个核心风险类别(ASI01-ASI10)。这对于安全团队评估、分类和解决复杂AI代理系统中的漏洞至关重要。
查看详情
提示词与技能优化器
prompt-improver
jeremylongshore/claude-code-plugins-plus-skills
90
本技能用于全面分析和改进插件提示词、技能定义及命令指令。它从清晰度、安全性、有效性、完整性和简洁性五个维度进行评估,提供详细的评分卡和可操作的重写建议,确保内容符合最佳实践,提升AI性能。
查看详情
上一页
1
2
语言
简体中文
English