登录
下载
Skill UI
浏览并发现
9688+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
A/B测试
,共找到
52
条记录
默认排序
最新上传
最多下载
配置Fathom AI API认证
fathom-install-auth
jeremylongshore/claude-code-plugins-plus-skills
480
本技能提供了一份关于配置Fathom AI API访问权限的详细指南。它指导用户如何生成API密钥、设置环境配置,并测试API连接,从而确保能够成功调用Fathom的API,获取会议记录、摘要和行动项等关键会议数据。
查看详情
Abridge医疗AI持续集成
abridge-ci-integration
jeremylongshore/claude-code-plugins-plus-skills
306
用于为Abridge临床AI集成构建完整的CI/CD流程。该流程通过GitHub Actions自动化执行,重点包括FHIR资源格式验证、PHI泄露扫描(确保HIPAA合规性)以及沙箱环境的端到端集成测试。确保医疗AI应用的安全性与可靠性。
查看详情
Abridge环境AI临床文档生成
abridge-hello-world
jeremylongshore/claude-code-plugins-plus-skills
190
本示例提供了一个最小化的工作模型,展示了Abridge环境下的AI临床文档自动化流程。用户可以通过模拟一次完整的诊疗会话,提交对话记录,系统将自动生成高度结构化的临床病历(包括主诉、病史、评估等),并提取相关的ICD/CPT编码,适用于测试医疗信息系统集成和AI数据结构化能力。
查看详情
AI安全扫描与漏洞检测
aig-scanner
Tencent/AI-Infra-Guard
240
本工具依托红心实验室的AI-Infra-Guard框架,提供全方位的AI安全扫描服务。可对AI基础设施、工具、技能、Agent以及大型语言模型进行深度安全审计和漏洞检测,包括越狱测试,确保AI系统的安全性和可靠性。
查看详情
自动AI智能体进化与优化
evolving-ai-agents
Orchestra-Research/AI-Research-SKILLs
63
A-Evolve是一个通用框架,用于通过LLM驱动的进化算法,自动优化和迭代改进AI智能体。它通过在标准基准测试(Benchmarks)上运行“求解-观察-进化”循环,持续优化智能体的提示词、技能和记忆,实现自学习的、性能增强的智能体。
查看详情
家庭安防AI基准测试套件
home-security-ai-benchmark
SharpAI/DeepCamera
379
本套件是一个全面的评估工具,用于基准测试大型语言模型(LLM)和视觉语言模型(VLM)在家庭安防领域的性能。它涵盖了143项测试,覆盖了工具使用、提示注入抵抗性、上下文推理、警报分诊和场景分析等16个关键领域,旨在确保智能家居AI系统的稳健性。
查看详情
室内安全隐患检测基准
homesafe-bench
SharpAI/DeepCamera
444
本基准测试用于评估视觉语言模型(VLM)从静态图像中识别室内环境潜在安全隐患的能力。测试覆盖了火灾、电路、跌倒、儿童安全和坠物等五大类别的40个场景,旨在模拟真实世界的固定安防监控,提供VLM实用安全检测能力的严格衡量标准。
查看详情
大模型链评估与回归测试
langchain-eval-harness
jeremylongshore/claude-code-plugins-plus-skills
103
本工具提供了一套全面的、可复现的LLM链和智能体评估系统。它集成了黄金数据集管理、LangSmith评估、RAGAS指标、deepeval LLM判别等功能。适用于为新构建的链条设置质量基线、诊断模型切换后的性能退化,以及在CI/CD流程中设置回归检测门禁。
查看详情
LangChain提示工程与版本控制
langchain-prompt-engineering
jeremylongshore/claude-code-plugins-plus-skills
447
本技能为LangChain应用提供了专业的提示工程解决方案。它解决了代码中嵌入式提示字符串易出错的问题,指导开发者将提示集中化并版本化。核心功能包括利用LangSmith平台进行提示的发布、回滚和A/B测试,通过固定的Commit Hash实现生产环境的稳定版本锁定,确保LLM应用的提示层可靠性。
查看详情
AI/LLM安全红队测试指南
offensive-ai-security
SnailSploit/Claude-Red
479
提供一套完整的AI/LLM系统安全渗透测试方法论,用于评估大型语言模型和AI应用的鲁棒性。涵盖提示词注入、越狱、数据投毒、模型提取等高级攻击向量,适用于进行AI系统的红队演练和安全评估。
查看详情
智能体技能全周期创建与优化
skill-creator-pro
libukai/awesome-agent-skills
370
本技能提供了一个完整的、结构化的流程,指导用户从零开始创建、改进和优化任何领域的AI智能体技能。它涵盖了从概念理解、设计架构、编写代码到执行严格测试和性能优化的全部阶段,确保生成的技能逻辑严谨、触发准确且实用。
查看详情
智能家居视频异常检测基准
smarthome-video-anomaly-benchmark
SharpAI/DeepCamera
102
本基准测试套件专用于评估视觉语言模型(VLM)在智能家居视频异常检测方面的能力。它基于真实的家庭数据集,覆盖了安全入侵、老人跌倒、宠物异常行为等多个生活场景。该测试要求模型进行深度多帧视频理解,是检验AI系统视频理解能力和实时监测准确性的专业级工具。
查看详情
上一页
1
2
3
4
5
下一页
语言
简体中文
English