登录
下载
Skill UI
浏览并发现
9668+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
UI测试
,共找到
30
条记录
默认排序
最新上传
最多下载
A/B测试配置生成器
a-b-test-config-creator
jeremylongshore/claude-code-plugins-plus-skills
96
此技能自动生成用于机器学习部署的A/B测试配置,提供规范流程、代码示例和校验建议,帮助模型上线后具备完整的监控与灰度能力。
查看详情
ADK智能体构建器
adk-agent-builder
jeremylongshore/claude-code-plugins-plus-skills
202
通过 Google ADK 与 Claude 组合,快速生成具备 React 循环、多智能体协作、工具扩展、工作流自动化及测试骨架的生产级智能体。
查看详情
智能体系统评估框架
evaluation
sickn33/antigravity-awesome-skills
70
该技能用于构建复杂的智能体系统评估框架。它解决了智能体系统非确定性和多路径决策的难题,指导用户进行系统性性能测试,用于验证上下文工程的选择,并衡量跨多个质量维度(如事实准确性、工具效率)的持续改进。
查看详情
Ideogram 图像生成入门指南
ideogram-hello-world
jeremylongshore/claude-code-plugins-plus-skills
349
本指南提供了使用Ideogram API生成AI图像的完整入门示例。它提供了cURL、TypeScript和Python等多种语言的实战代码,涵盖了从基础调用到高级参数设置(如风格、比例)的全部流程。非常适合开发者进行API集成测试和快速上手。
查看详情
Kling AI模型升级与迁移指南
klingai-upgrade-migration
jeremylongshore/claude-code-plugins-plus-skills
186
本指南为开发者提供了安全迁移Kling AI视频生成模型版本(如v1.x到v2.x)的全面指导。内容涵盖了版本间的兼容性变更、参数差异、功能矩阵(包括原生音频和相机控制)以及代码示例,帮助开发者理解如何进行模型升级、A/B测试和实现可靠的回滚机制,确保API集成顺利。
查看详情
LangChain生产环境就绪度清单
langchain-prod-checklist
jeremylongshore/claude-code-plugins-plus-skills
131
这是一份全面的LangChain应用程序生产环境就绪度清单。它系统性地覆盖了从配置管理、错误处理、可观测性(如LangSmith)、性能优化、安全加固(防止提示注入、处理PII)到严格测试和部署策略等多个维度,帮助开发者确保AI应用具备高可靠性和可维护性,适用于应用上线前或现有系统的审计。
查看详情
Langfuse CI/CD:LLM质量测试集成
langfuse-ci-integration
jeremylongshore/claude-code-plugins-plus-skills
444
本指南展示如何将Langfuse集成到CI/CD流水线(例如GitHub Actions)中,用于自动化大型语言模型(LLM)的质量测试。用户可以实现提示词回归测试、调用链验证和实验驱动的质量门禁,确保AI应用的稳定性和性能。
查看详情
Langfuse LLM评估与基准测试
langfuse-core-workflow-b
jeremylongshore/claude-code-plugins-plus-skills
87
本技能提供一套完整的LLM评估工作流,使用Langfuse平台实现系统质量管理。涵盖了利用评分机制、收集用户反馈、管理版本化的Prompt、创建测试数据集、运行自动化实验(包括LLM-as-a-Judge)等多个环节,旨在帮助开发者进行全面的模型性能基准测试和质量保障。
查看详情
林迪AI智能体调试工具包
lindy-debug-bundle
jeremylongshore/claude-code-plugins-plus-skills
276
本工具包是专为解决复杂智能体(Agent)故障而设计的综合诊断工具。它系统地收集环境信息(如Node.js、Python版本),测试Webhook和主流API(如Slack、Gmail)的连接状态,并指导用户回顾任务历史记录,最终生成一份结构化的支持报告,极大地提高了故障排查的效率。
查看详情
LLM模型评估与性能测试
llm-evaluation
sickn33/antigravity-awesome-skills
356
提供了一套全面的大型语言模型(LLM)评估框架。内容涵盖自动化指标(如BLEU、ROUGE、BERTScore)、人工评估维度以及使用LLM作为裁判的先进方法。适用于系统性地衡量模型性能、对比不同Prompt或模型,确保AI应用的可靠性和可部署性。
查看详情
Mistral AI API 快速上手指南
mistral-hello-world
jeremylongshore/claude-code-plugins-plus-skills
148
本指南提供了与 Mistral AI API 集成的最小可行代码示例。涵盖了基础聊天补全、流式响应、多轮对话以及结构化 JSON 输出等核心大模型功能。适用于开发者快速学习和测试 Mistral AI 的各种高级应用模式。
查看详情
生产级机器学习工程与MLOps
ml-engineer
sickn33/antigravity-awesome-skills
386
这是一套全面的技能体系,专注于构建、部署和管理生产级的机器学习系统。知识覆盖现代ML框架(如PyTorch、TensorFlow)、模型服务(基于Kubernetes)、高级特征工程和全面的MLOps实践(包括监控、A/B测试和持续集成)。旨在交付可扩展、可靠、具备商业价值的AI解决方案。
查看详情
1
2
3
下一页
语言
简体中文
English