登录
下载
Skill UI
浏览并发现
7282+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
QLoRA
,共找到
9
条记录
默认排序
最新上传
最多下载
Axolotl大模型微调助手
axolotl
Orchestra-Research/AI-Research-SKILLs
392
为 Axolotl 提供大模型微调指导,涵盖 YAML 配置、LoRA/QLoRA、DPO 等优化策略及多模态支持,适用于开发、调试和查阅文档。
查看详情
Axolotl大模型微调助手
axolotl
Orchestra-Research/AI-Research-SKILLs
392
为 Axolotl 提供大模型微调指导,涵盖 YAML 配置、LoRA/QLoRA、DPO 等优化策略及多模态支持,适用于开发、调试和查阅文档。
查看详情
LLM微调专家指南
fine-tuning-expert
Jeffallan/claude-skills
425
指导模型工程师完成数据准备、LoRA/QLoRA 适配器配置、训练监控、评估指标收集以及 Adapter 合并部署等 LLM 微调与量化的关键流程。
查看详情
GPTQ LLM 量化指南
gptq
Orchestra-Research/AI-Research-SKILLs
277
GPTQ 提供后训练 4 位量化,可在 RTX 4090/3090 等消费级 GPU 上将大模型压缩至 1/4 内存并加速推理,同时维持低于 2% 的困惑度损失,适合部署和 QLoRA 微调。
查看详情
大型语言模型(LLM)实现与训练
implementing-llms-litgpt
Orchestra-Research/AI-Research-SKILLs
252
LitGPT提供了一个用于实现和训练超过20种前沿大型语言模型(如Llama, Gemma, Mistral)的工具。它支持完整的微调(Fine-tuning)、高效的LoRA适配以及从零开始的预训练流程。适用于需要清晰模型结构、学术理解或生产级部署的开发者。
查看详情
LLaMA 工厂指南
llama-factory
Orchestra-Research/AI-Research-SKILLs
327
提供 llama-factory 的全面指南,通过 WebUI 无代码方式帮助微调大模型,涵盖 QLoRA/LoRA 量化、多模态和 HuggingFace 生态下的常见模型及调试技巧。
查看详情
PEFT 高效微调指南
peft-fine-tuning
Orchestra-Research/AI-Research-SKILLs
96
介绍 HuggingFace PEFT 中 LoRA/QLoRA 微调流程,帮助在有限 GPU 上只训练小于 1% 参数并高效管理多适配器部署。
查看详情
LLM 量化优化工具
quantizing-models-bitsandbytes
Orchestra-Research/AI-Research-SKILLs
398
使用 bitsandbytes 将 HuggingFace 大模型量化到 8 位或 4 位,显存降低 50%-75%,并兼容 QLoRA 以及 8 位优化器,适合显存受限时快速部署与训练。
查看详情
Unsloth 快速微调指南
unsloth
Orchestra-Research/AI-Research-SKILLs
272
Unsloth 技能提供快速微调指导,涵盖 LoRA/QLoRA、内存优化、接口实用和调试建议,帮助开发者高效构建定制模型。
查看详情
1
语言
简体中文
English