登录
下载
Skill UI
浏览并发现
5946+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
量化
,共找到
31
条记录
默认排序
最新上传
最多下载
激活感知权重量化
awq-quantization
Orchestra-Research/AI-Research-SKILLs
151
AWQ 通过激活感知的 4-bit 权重量化,在有限 GPU 内存、使用 vLLM 或 Marlin 内核时,为指令调优或多模态大模型提供约 3 倍推理加速且误差低于 5%。
查看详情
代码模型基准评测
evaluating-code-models
Orchestra-Research/AI-Research-SKILLs
436
使用 BigCode 评测工具在 HumanEval、MBPP、MultiPL-E 等 15+ 基准上跑 pass@k 指标,用于比较代码模型的生成质量、多语言支持以及量化或指令调优版本的表现。
查看详情
LLM 微调专家指南
fine-tuning-expert
Jeffallan/claude-skills
360
面向大语言模型的实战微调流程,涵盖数据集准备、LoRA/QLoRA/PEFT 适配器配置、超参设置、训练监控、评估对比及量化部署等生产级步骤。
查看详情
GGUF 量化指南
gguf-quantization
Orchestra-Research/AI-Research-SKILLs
412
提供 GGUF 格式与 llama.cpp 量化流程,涵盖模型转换、imatrix 校准、量化和推理命令,帮助在 CPU/Apple Silicon 等消费级设备上部署大模型,无需 GPU。
查看详情
GPTQ 大模型量化
gptq
Orchestra-Research/AI-Research-SKILLs
419
通过 GPTQ 的组束量化将大模型压缩到 4bit,在 RTX 4090/3090 等消费级 GPU 上实现 4 倍内存缩减、快速推理和 PEFT+QLoRA 兼容,便于部署与微调。
查看详情
半二次量化模型
hqq-quantization
Orchestra-Research/AI-Research-SKILLs
160
HQQ 提供无需校准数据的半二次量化,支持 1-8 位、可配置多个推理后端(PyTorch、TorchAO、BitBlas、Marlin),适合极速量化流程、零数据部署及 HuggingFace/vLLM 上的 PEFT/LoRA 微调。
查看详情
Llama.cpp CPU 推理
llama-cpp
Orchestra-Research/AI-Research-SKILLs
382
使用 llama.cpp 可在 CPU、Apple Silicon 以及 AMD/Intel GPU 等非 NVIDIA 环境上本地运行 LLM 推理,适合边缘设备和 CUDA 不可用的场景,通过 GGUF 量化实现更低内存与更快速度。
查看详情
Mistral SDK 实践模式
mistral-sdk-patterns
jeremylongshore/claude-code-plugins-plus-skills
267
面向 TypeScript 与 Python 的 Mistral SDK 生产级模式,涵盖客户端初始化、对话、流式输出、函数调用、向量化及常见错误处理,适用于集成改造与团队标准化。
查看详情
模型量化部署助手
model-quantization-tool
jeremylongshore/claude-code-plugins-plus-skills
222
自动化提供模型量化部署的指导,涵盖工具使用、最佳实践以及面向推理、MLops 与监控的生产准备流程。
查看详情
Pandas 高级操作指南
pandas-pro
Jeffallan/claude-skills
447
提供高效 pandas DataFrame 分析、清洗、聚合、合并、时间序列重采样等操作,强调向量化、类型控制、内存验证与结果校验,适合生产级数据转换任务。
查看详情
LoRA 参数高效微调
peft-fine-tuning
Orchestra-Research/AI-Research-SKILLs
344
介绍PEFT/LoRA/QLoRA在7B-70B大模型上的参数高效微调,涵盖低内存训练、<1%参数更新、多适配器与量化实战场景。
查看详情
量化交易分析助手
quant-analyst
sickn33/antigravity-awesome-skills
62
辅助量化分析师完成算法策略设计、回测、风险指标计算与组合优化,强调数据清洗、稳健测试和可验证输出,适用于金融建模与交易研究流程。
查看详情
1
2
3
下一页
语言
简体中文
English