下载

Skill UI

浏览并发现 10029+ 精选技能

全部编程开发人工智能设计创意产品商业数据科学市场营销职场通用效率工具硬件工程语言学习

搜索推理部署，共找到 47 条记录

默认排序最新上传最多下载

AWQ 激活感知权重量化

awq-quantization

Orchestra-Research/AI-Research-SKILLs

AWQ 利用激活感知权重保护技术，将 7B-70B 模型压缩到 4-bit，在受限显存上保持精度并提升近 3 倍推理速度，可配合 vLLM、Marlin 等加速后端部署大模型。

Azure ML部署助手

azure-ml-deployer

jeremylongshore/claude-code-plugins-plus-skills

自动响应 Azure ML Deployer 相关需求，提供从模型推理、部署流程到监控与生产化的规范化指导、代码与配置生成及校验，便于快速落地机器学习上线。

Azure ML部署助手

azure-ml-deployer

jeremylongshore/claude-code-plugins-plus-skills

自动响应 Azure ML Deployer 相关需求，提供从模型推理、部署流程到监控与生产化的规范化指导、代码与配置生成及校验，便于快速落地机器学习上线。

批量推理管道

batch-inference-pipeline

jeremylongshore/claude-code-plugins-plus-skills

引导 ML 团队构建批量推理管道，涵盖方案、监控与上线准备，并生成部署所需的代码与配置。

领先计算机视觉架构师

computer-vision-expert

sickn33/antigravity-awesome-skills

提供设计、实现和优化前沿计算机视觉流程的专业指导。涵盖实时目标检测（YOLO26）、基于提示的语义分割（SAM 3）以及利用视觉语言模型（VLM）进行高级视觉推理。适用于机器人、自动驾驶和工业检测等场景，尤其擅长3D重建和边缘侧部署优化。

Databricks ML模型全生命周期管理

databricks-core-workflow-b

jeremylongshore/claude-code-plugins-plus-skills

本流程展示了在Databricks上完整的MLOps生命周期。它指导用户如何使用Feature Store进行特征工程，通过MLflow进行实验跟踪和模型训练，在Model Registry中管理模型版本，最终部署为可实时推理的API服务。适用于构建可生产化、高可靠性的机器学习系统。

特征仓库连接器

feature-store-connector

jeremylongshore/claude-code-plugins-plus-skills

在机器学习部署中自动提供特征仓库连接器的配置指导、代码生成与生产监控建议，帮助高质量交付在线推理管道。

GGUF量化：高效大模型推理

gguf-quantization

Orchestra-Research/AI-Research-SKILLs

本指南深入介绍GGUF格式和模型量化技术，旨在实现大语言模型（LLM）在消费级硬件上的高效推理。通过采用GGUF标准格式和K-quant方法进行模型压缩，可以显著降低内存和硬件要求，使开发者能够在Apple Silicon、CPU或边缘设备上部署高性能AI应用。

GPTQ LLM 量化指南

Orchestra-Research/AI-Research-SKILLs

GPTQ 提供后训练 4 位量化，可在 RTX 4090/3090 等消费级 GPU 上将大模型压缩至 1/4 内存并加速推理，同时维持低于 2% 的困惑度损失，适合部署和 QLoRA 微调。

Groq跨云平台部署指南

groq-deploy-integration

jeremylongshore/claude-code-plugins-plus-skills

本指南详细介绍了如何将基于Groq推理API的应用部署到各种主流生产环境，包括Vercel Edge、Cloud Run、Docker等。它提供了完整的部署流程和代码示例，帮助开发者配置平台特定的环境和密钥，确保AI服务具备低延迟和高可用性。

推理延迟分析器

inference-latency-profiler

jeremylongshore/claude-code-plugins-plus-skills

本技能自动处理推理延迟分析器相关任务，在 ML 部署场景中提供模型服务、MLOps 管道、监控和生产优化等按步骤指导，生成生产级代码并校验输出标准，助力快速完成推理性能调优。

知识蒸馏：大模型压缩

knowledge-distillation

Orchestra-Research/AI-Research-SKILLs

知识蒸馏（KD）是一种核心的AI模型压缩技术。它旨在将性能强大的大型语言模型（Teacher）的知识，高效地转移给更小、更易于部署的学生模型（Student）。这使得开发者能够在不损失关键性能的前提下，大幅降低推理成本，实现将前沿大模型能力落地到实际应用场景。

12 3 4 下一页

语言