登录
下载
Skill UI
浏览并发现
6926+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
CPU
,共找到
5
条记录
默认排序
最新上传
最多下载
GGUF量化:高效大模型推理
gguf-quantization
Orchestra-Research/AI-Research-SKILLs
327
本指南深入介绍GGUF格式和模型量化技术,旨在实现大语言模型(LLM)在消费级硬件上的高效推理。通过采用GGUF标准格式和K-quant方法进行模型压缩,可以显著降低内存和硬件要求,使开发者能够在Apple Silicon、CPU或边缘设备上部署高性能AI应用。
查看详情
Hugging Face云工作流执行
hugging-face-jobs
sickn33/antigravity-awesome-skills
170
用于在Hugging Face的托管云基础设施上执行复杂的计算工作负载。无需本地环境配置,支持使用云端的CPU、GPU或TPU资源。适用于大规模数据处理、批处理推理、可复现的模型训练和周期性自动化任务,并将结果持久化到Hugging Face Hub。
查看详情
CPU/边缘本地大模型推理
llama-cpp
Orchestra-Research/AI-Research-SKILLs
150
llama.cpp是一个纯C/C++编写的轻量级推理框架,专为在资源受限的设备上运行大型语言模型(LLM)而设计。它特别适用于没有高性能NVIDIA GPU(CUDA)的场景,非常适合Apple Silicon、AMD/Intel GPU以及边缘计算设备。通过支持GGUF量化,可以实现内存占用和推理速度的显著优化,支持本地跨平台部署。
查看详情
RWKV 混合架构
rwkv-architecture
Orchestra-Research/AI-Research-SKILLs
115
RWKV 是结合 Transformer 训练与 RNN 推理的混合架构,提供线性时间推理、无限上下文与零 KV 缓存,可在流式或超长上下文场景中用 CUDA/CPU 低内存部署。
查看详情
Claude 性能监控
claude-monitor
sickn33/antigravity-awesome-skills
339
诊断 Claude Code 与本地系统的性能瓶颈,监控 CPU、内存、磁盘、浏览器和 Claude API 延迟,生成健康报表并根据诊断结果给出优化建议或持续监控方案,适用于用户投诉卡顿、慢响应等场景。
查看详情
1
语言
简体中文
English