登录
下载
Skill UI
浏览并发现
10393+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
COM
,共找到
615
条记录
默认排序
最新上传
最多下载
PyRIT:多轮LLM对抗攻击编排
orchestrating-llm-attacks-with-pyrit
mukul975/Anthropic-Cybersecurity-Skills
282
PyRIT是一个开源的AI红队测试工具,用于自动化地对对话式大语言模型(LLM)进行多轮对抗性测试。它模拟了真实攻击者的行为,通过“攻击模型”和“评分模型”的协作循环,实现渐进式(Crescendo)或分支式(TAP)的攻击链。该工具旨在检测LLM在状态化对话中可能存在的复杂安全漏洞,例如提示注入和越狱。
查看详情
大型语言模型安全红队测试
red-teaming-llms-with-garak
mukul975/Anthropic-Cybersecurity-Skills
339
本技能利用NVIDIA的Garak框架,对大型语言模型(LLMs)进行全面的红队安全测试。它通过发送数千条对抗性提示词,检测模型是否存在越狱、提示注入、数据泄露或生成有害内容等关键安全漏洞。适用于模型部署前后的安全基线验证和AI风险评估。
查看详情
智能体AI工具调用安全防护
securing-agentic-ai-tool-invocation
mukul975/Anthropic-Cybersecurity-Skills
266
本技能提供了一套纵深防御框架,用于保护自主AI智能体工具调用过程。它核心实现了工具白名单、最小权限身份绑定和人工干预(HITL)机制,旨在防御提示注入和工具投毒等高级威胁,适用于需要严格合规和审计流程的AI应用场景。
查看详情
上一页
1
2
3
...
49
50
51
52
语言
简体中文
English