登录
下载
Skill UI
浏览并发现
9180+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
推理服务
,共找到
16
条记录
默认排序
最新上传
最多下载
自主多模型AI代理
blockrun
sickn33/antigravity-awesome-skills
360
BlockRun是一个智能代理网关,通过钱包系统连接多种外部AI服务。它可以根据用户需求,自动路由请求至最合适的模型(如DALL-E生成图像、Grok进行实时X数据搜索、GPT-5.2进行复杂推理)。用户只需支付相应的微额费用,即可无缝使用所有AI的能力,实现了能力的扩展和成本控制。
查看详情
Databricks ML模型全生命周期管理
databricks-core-workflow-b
jeremylongshore/claude-code-plugins-plus-skills
121
本流程展示了在Databricks上完整的MLOps生命周期。它指导用户如何使用Feature Store进行特征工程,通过MLflow进行实验跟踪和模型训练,在Model Registry中管理模型版本,最终部署为可实时推理的API服务。适用于构建可生产化、高可靠性的机器学习系统。
查看详情
推理延迟分析器
inference-latency-profiler
jeremylongshore/claude-code-plugins-plus-skills
208
本技能自动处理推理延迟分析器相关任务,在 ML 部署场景中提供模型服务、MLOps 管道、监控和生产优化等按步骤指导,生成生产级代码并校验输出标准,助力快速完成推理性能调优。
查看详情
Modal 无服务器 GPU 平台
modal-serverless-gpu
Orchestra-Research/AI-Research-SKILLs
226
Modal 无服务器 GPU 平台提供按秒计费的按需 GPU 访问,从 T4 到 H200,可快速部署模型 API、执行批处理作业并跳过基础设施运维,适合原型验证与推理训练任务。
查看详情
Onnx转换部署指南
onnx-converter
jeremylongshore/claude-code-plugins-plus-skills
113
在 ML 部署场景下自动提供 onnx 转换器的服务指导,涵盖推理、管道、监控与优化,并产出可投入生产的代码与配置。
查看详情
预测监控助手
prediction-monitor
jeremylongshore/claude-code-plugins-plus-skills
240
预测监控助手自动处理机器学习部署中的监控任务,提供逐步指南、最佳实践、生产级代码配置和验证,确保服务与推理流程稳定可靠。
查看详情
SGLang 结构化推理服务
sglang
Orchestra-Research/AI-Research-SKILLs
475
SGLang 是面向 LLM/VLM 的高性能服务框架,采用 RadixAttention 前缀缓存实现 JSON/正则/语法结构化输出、函数调用型代理流程,并在多 GPU 生产环境中比 vLLM 快 5 倍。
查看详情
流式推理部署
streaming-inference-setup
jeremylongshore/claude-code-plugins-plus-skills
462
在询问流式推理架构或实施方案时,自动提供模型服务、MLOps、监控与生产就绪配置的部署流程指导。
查看详情
Torchserve 配置生成器
torchserve-config-generator
jeremylongshore/claude-code-plugins-plus-skills
258
自动生成 TorchServe 部署配置,提供模型服务、MLOps 流水线、推理与生产监控的实践指导,帮助保障机器学习部署的规范性与可靠性。
查看详情
Triton 推理配置
triton-inference-config
jeremylongshore/claude-code-plugins-plus-skills
181
自动提供 Triton 推理配置指导,针对模型服务、MLOps 管道、监控与生产环境优化,生成符合业界最佳实践的配置与代码。
查看详情
Modal 云端GPU平台
modal
K-Dense-AI/claude-scientific-skills
156
Modal 提供云端无服务器 Python 运行环境,按需调度 GPU、持久卷、Web 接口等,方便部署模型、推理服务和批处理作业,不用写 Dockerfile。
查看详情
Modal 云端GPU平台
modal
K-Dense-AI/scientific-agent-skills
135
Modal 提供云端无服务器 Python 运行环境,按需调度 GPU、持久卷、Web 接口等,方便部署模型、推理服务和批处理作业,不用写 Dockerfile。
查看详情
1
2
下一页
语言
简体中文
English