登录
下载
Skill UI
浏览并发现
9119+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
边缘AI
,共找到
6
条记录
默认排序
最新上传
最多下载
GGUF量化:高效大模型推理
gguf-quantization
Orchestra-Research/AI-Research-SKILLs
429
本指南深入介绍GGUF格式和模型量化技术,旨在实现大语言模型(LLM)在消费级硬件上的高效推理。通过采用GGUF标准格式和K-quant方法进行模型压缩,可以显著降低内存和硬件要求,使开发者能够在Apple Silicon、CPU或边缘设备上部署高性能AI应用。
查看详情
CPU/边缘本地大模型推理
llama-cpp
Orchestra-Research/AI-Research-SKILLs
249
llama.cpp是一个纯C/C++编写的轻量级推理框架,专为在资源受限的设备上运行大型语言模型(LLM)而设计。它特别适用于没有高性能NVIDIA GPU(CUDA)的场景,非常适合Apple Silicon、AMD/Intel GPU以及边缘计算设备。通过支持GGUF量化,可以实现内存占用和推理速度的显著优化,支持本地跨平台部署。
查看详情
LLM模型剪枝实用指南
model-pruning
Orchestra-Research/AI-Research-SKILLs
437
通过 Wanda、SparseGPT 与 N:M 结构化剪枝,快速压缩大语言模型,提升稀疏度与推理速度,无需再训练即可部署在移动或边缘硬件。
查看详情
Perplexity云平台部署集成指南
perplexity-deploy-integration
jeremylongshore/claude-code-plugins-plus-skills
244
本指南提供了使用 Perplexity Sonar API 构建和部署应用的完整流程。涵盖了 Vercel、Cloud Run 和 Docker 等主流云平台的部署配置,支持构建生产就绪的API端点。用户可以管理API密钥、利用边缘函数和Redis缓存,确保应用在高可用性和高性能方面达到最佳效果。
查看详情
端到端计算机视觉系统部署
senior-computer-vision
alirezarezvani/claude-skills
256
提供完整的视觉AI系统构建流程指导。内容涵盖目标检测、实例分割、语义分割和视频分析等核心能力,从数据集准备、架构选择、PyTorch训练到模型优化(ONNX/TensorRT)和生产部署,确保系统能在各种边缘或云端设备上高效运行。
查看详情
Qdrant部署方案选择指南
qdrant-deployment-options
github/awesome-copilot
278
本指南用于帮助用户选择最适合的Qdrant部署方案。它详细对比了本地模式、自托管、Qdrant Cloud(零运维)和Qdrant EDGE四种部署模式,帮助用户根据项目需求(如是否需要完全控制、运维负担、数据驻留或最低延迟)来决定是用于原型开发、自建集群还是边缘计算应用。
查看详情
1
语言
简体中文
English