登录
下载
Skill UI
浏览并发现
9967+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
GPU 加速
,共找到
7
条记录
默认排序
最新上传
最多下载
AWQ 激活感知权重量化
awq-quantization
Orchestra-Research/AI-Research-SKILLs
421
AWQ 利用激活感知权重保护技术,将 7B-70B 模型压缩到 4-bit,在受限显存上保持精度并提升近 3 倍推理速度,可配合 vLLM、Marlin 等加速后端部署大模型。
查看详情
FAISS:高效向量相似性搜索库
faiss
Orchestra-Research/AI-Research-SKILLs
276
FAISS(Facebook AI Similarity Search)是一个用于高效相似性搜索和聚类的库。它支持对数十亿级别的密集向量进行索引和搜索,具备GPU加速和多种索引类型(如Flat、IVF、HNSW)。适用于构建需要超高吞吐量和低延迟的超大规模应用,特别是在RAG、推荐系统等领域,用于快速的k-NN检索或纯向量相似度匹配。
查看详情
GPTQ LLM 量化指南
gptq
Orchestra-Research/AI-Research-SKILLs
81
GPTQ 提供后训练 4 位量化,可在 RTX 4090/3090 等消费级 GPU 上将大模型压缩至 1/4 内存并加速推理,同时维持低于 2% 的困惑度损失,适合部署和 QLoRA 微调。
查看详情
OpenRLHF训练套件
openrlhf-training
Orchestra-Research/AI-Research-SKILLs
474
一个基于Ray和vLLM的高性能RLHF训练框架,兼容PPO、GRPO、RLOO、DPO,借助ZeRO-3与分布式架构在多GPU集群上加速7B-70B+大模型的策略与奖励优化流程。
查看详情
Whisper 多语种语音识别
whisper
Orchestra-Research/AI-Research-SKILLs
298
Whisper 是 OpenAI 提供的多语种语音识别与英文翻译模型,支持 99 种语言、批量/流式转录及 GPU 加速,非常适合播客、会议、音视频转录和嘈杂环境下的多语言音频处理。
查看详情
YOLO 2026实时目标检测
yolo-detection-2026
SharpAI/DeepCamera
220
基于最新的YOLO 2026模型,提供高性能的实时物体检测功能。该技能可识别80多个COCO物体类别,并输出带有边界框和置信度的检测结果。它支持自动硬件加速,能够自动优化模型以适配不同的计算平台(如CUDA、MPS、OpenVINO等),确保无论在CPU、GPU还是NPU上运行,都能达到最佳的检测速度和准确性。
查看详情
实时目标检测:OpenVINO加速
yolo-detection-2026-openvino
SharpAI/DeepCamera
72
使用Intel OpenVINO运行时实现高性能的实时目标检测。通过Docker容器运行,确保跨平台兼容性。该技能支持利用多种Intel加速设备(如NCS2、iGPU),用户可根据需求调整检测置信度、目标类别、处理帧率和模型精度,适用于工业和视觉监控场景。
查看详情
1
语言
简体中文
English