登录
下载
Skill UI
浏览并发现
10029+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
推理部署
,共找到
47
条记录
默认排序
最新上传
最多下载
AWQ 激活感知权重量化
awq-quantization
Orchestra-Research/AI-Research-SKILLs
421
AWQ 利用激活感知权重保护技术,将 7B-70B 模型压缩到 4-bit,在受限显存上保持精度并提升近 3 倍推理速度,可配合 vLLM、Marlin 等加速后端部署大模型。
查看详情
Azure ML部署助手
azure-ml-deployer
jeremylongshore/claude-code-plugins-plus-skills
77
自动响应 Azure ML Deployer 相关需求,提供从模型推理、部署流程到监控与生产化的规范化指导、代码与配置生成及校验,便于快速落地机器学习上线。
查看详情
Azure ML部署助手
azure-ml-deployer
jeremylongshore/claude-code-plugins-plus-skills
77
自动响应 Azure ML Deployer 相关需求,提供从模型推理、部署流程到监控与生产化的规范化指导、代码与配置生成及校验,便于快速落地机器学习上线。
查看详情
批量推理管道
batch-inference-pipeline
jeremylongshore/claude-code-plugins-plus-skills
50
引导 ML 团队构建批量推理管道,涵盖方案、监控与上线准备,并生成部署所需的代码与配置。
查看详情
领先计算机视觉架构师
computer-vision-expert
sickn33/antigravity-awesome-skills
285
提供设计、实现和优化前沿计算机视觉流程的专业指导。涵盖实时目标检测(YOLO26)、基于提示的语义分割(SAM 3)以及利用视觉语言模型(VLM)进行高级视觉推理。适用于机器人、自动驾驶和工业检测等场景,尤其擅长3D重建和边缘侧部署优化。
查看详情
Databricks ML模型全生命周期管理
databricks-core-workflow-b
jeremylongshore/claude-code-plugins-plus-skills
121
本流程展示了在Databricks上完整的MLOps生命周期。它指导用户如何使用Feature Store进行特征工程,通过MLflow进行实验跟踪和模型训练,在Model Registry中管理模型版本,最终部署为可实时推理的API服务。适用于构建可生产化、高可靠性的机器学习系统。
查看详情
特征仓库连接器
feature-store-connector
jeremylongshore/claude-code-plugins-plus-skills
213
在机器学习部署中自动提供特征仓库连接器的配置指导、代码生成与生产监控建议,帮助高质量交付在线推理管道。
查看详情
GGUF量化:高效大模型推理
gguf-quantization
Orchestra-Research/AI-Research-SKILLs
403
本指南深入介绍GGUF格式和模型量化技术,旨在实现大语言模型(LLM)在消费级硬件上的高效推理。通过采用GGUF标准格式和K-quant方法进行模型压缩,可以显著降低内存和硬件要求,使开发者能够在Apple Silicon、CPU或边缘设备上部署高性能AI应用。
查看详情
GPTQ LLM 量化指南
gptq
Orchestra-Research/AI-Research-SKILLs
81
GPTQ 提供后训练 4 位量化,可在 RTX 4090/3090 等消费级 GPU 上将大模型压缩至 1/4 内存并加速推理,同时维持低于 2% 的困惑度损失,适合部署和 QLoRA 微调。
查看详情
Groq跨云平台部署指南
groq-deploy-integration
jeremylongshore/claude-code-plugins-plus-skills
118
本指南详细介绍了如何将基于Groq推理API的应用部署到各种主流生产环境,包括Vercel Edge、Cloud Run、Docker等。它提供了完整的部署流程和代码示例,帮助开发者配置平台特定的环境和密钥,确保AI服务具备低延迟和高可用性。
查看详情
推理延迟分析器
inference-latency-profiler
jeremylongshore/claude-code-plugins-plus-skills
208
本技能自动处理推理延迟分析器相关任务,在 ML 部署场景中提供模型服务、MLOps 管道、监控和生产优化等按步骤指导,生成生产级代码并校验输出标准,助力快速完成推理性能调优。
查看详情
知识蒸馏:大模型压缩
knowledge-distillation
Orchestra-Research/AI-Research-SKILLs
417
知识蒸馏(KD)是一种核心的AI模型压缩技术。它旨在将性能强大的大型语言模型(Teacher)的知识,高效地转移给更小、更易于部署的学生模型(Student)。这使得开发者能够在不损失关键性能的前提下,大幅降低推理成本,实现将前沿大模型能力落地到实际应用场景。
查看详情
1
2
3
4
下一页
语言
简体中文
English