登录
下载
Skill UI
浏览并发现
5146+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
GPU
,共找到
40
条记录
默认排序
最新上传
最多下载
激活感知权重量化
awq-quantization
Orchestra-Research/AI-Research-SKILLs
151
AWQ 通过激活感知的 4-bit 权重量化,在有限 GPU 内存、使用 vLLM 或 Marlin 内核时,为指令调优或多模态大模型提供约 3 倍推理加速且误差低于 5%。
查看详情
TorchTitan 分布式大模型预训练
distributed-llm-pretraining-torchtitan
Orchestra-Research/AI-Research-SKILLs
228
TorchTitan 提供 PyTorch 原生的 4D 并行分布式大语言模型预训练能力,涵盖 FSDP2/TP/PP/CP、Float8、torch.compile 与分布式检查点,可在 8 到 512+ GPUs 上训练 Llama 3.1、DeepSeek V3 等模型。
查看详情
FAISS 向量相似搜索
faiss
Orchestra-Research/AI-Research-SKILLs
274
FAISS 是 Meta/ Facebook AI 的向量相似性搜索库,支持 Flat、IVF、HNSW 等索引、GPU 加速和亿量级向量检索,适用于高吞吐、低延迟的 k-NN 检索场景。
查看详情
GGUF 量化指南
gguf-quantization
Orchestra-Research/AI-Research-SKILLs
412
提供 GGUF 格式与 llama.cpp 量化流程,涵盖模型转换、imatrix 校准、量化和推理命令,帮助在 CPU/Apple Silicon 等消费级设备上部署大模型,无需 GPU。
查看详情
GPTQ 大模型量化
gptq
Orchestra-Research/AI-Research-SKILLs
419
通过 GPTQ 的组束量化将大模型压缩到 4bit,在 RTX 4090/3090 等消费级 GPU 上实现 4 倍内存缩减、快速推理和 PEFT+QLoRA 兼容,便于部署与微调。
查看详情
GPU资源优化器
gpu-resource-optimizer
jeremylongshore/claude-code-plugins-plus-skills
127
为机器学习部署提供 GPU 资源优化指导,生成可生产化配置并校验模型服务、运维流水线与监控场景的应用实践。
查看详情
Lambda实验室GPU云平台
lambda-labs-gpu-cloud
Orchestra-Research/AI-Research-SKILLs
160
Lambda Labs GPU 云提供按需与保留实例、SSH 访问、持久化文件系统和一键多节点集群,适合大规模训练与推理任务对高性能 GPU 的需求。
查看详情
Llama.cpp CPU 推理
llama-cpp
Orchestra-Research/AI-Research-SKILLs
382
使用 llama.cpp 可在 CPU、Apple Silicon 以及 AMD/Intel GPU 等非 NVIDIA 环境上本地运行 LLM 推理,适合边缘设备和 CUDA 不可用的场景,通过 GGUF 量化实现更低内存与更快速度。
查看详情
Modal 无服务器GPU
modal-serverless-gpu
Orchestra-Research/AI-Research-SKILLs
94
Modal 的无服务器 GPU 云平台帮助团队快速部署 ML 训练、推理及批处理任务,支持按秒计费、自动弹性伸缩、Python 原生资源定义、极速冷启动与容器缓存,免去运维烦恼。
查看详情
极简GPT训练指南
nanogpt
Orchestra-Research/AI-Research-SKILLs
239
NanoGPT 是一个约三百行的 PyTorch GPT-2 教学实现,可在 CPU 或多卡上训练莎士比亚或 OpenWebText,便于理解架构、微调预训练模型或自定义数据集。
查看详情
GPU 加速训练数据治理
nemo-curator
Orchestra-Research/AI-Research-SKILLs
322
NeMo Curator 通过 GPU 加速处理文本、图像、视频和音频数据,提供模糊/语义去重、质量过滤、PII 与 NSFW 检测等步骤,配合 RAPIDS 多 GPU 集群打造高质量 LLM 训练集。
查看详情
LLM可编程安全防护
nemo-guardrails
Orchestra-Research/AI-Research-SKILLs
108
NVIDIA 的 NeMo Guardrails 为 LLM 应用提供运行时安全机制,通过 Colang 2.0 可编程规则实现越狱检测、自查输入输出、事实核查、PII 屏蔽与毒性过滤,便于在 T4 生产环境中部署。
查看详情
1
2
3
4
下一页
语言
简体中文
English