登录
下载
Skill UI
浏览并发现
5019+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
QLoRA
,共找到
9
条记录
默认排序
最新上传
最多下载
Axolotl 微调指南
axolotl
Orchestra-Research/AI-Research-SKILLs
498
引导开发者使用 Axolotl 对大型模型进行微调,包含 YAML 配置示例、LoRA/QLoRA 与 DPO/KTO/ORPO/GRPO 流程、FSDP 参数建议、压缩检查点与调试技巧,适用于多模态训练场景。
查看详情
Axolotl 微调指南
axolotl
Orchestra-Research/AI-Research-SKILLs
498
引导开发者使用 Axolotl 对大型模型进行微调,包含 YAML 配置示例、LoRA/QLoRA 与 DPO/KTO/ORPO/GRPO 流程、FSDP 参数建议、压缩检查点与调试技巧,适用于多模态训练场景。
查看详情
LLM 微调专家指南
fine-tuning-expert
Jeffallan/claude-skills
360
面向大语言模型的实战微调流程,涵盖数据集准备、LoRA/QLoRA/PEFT 适配器配置、超参设置、训练监控、评估对比及量化部署等生产级步骤。
查看详情
GPTQ 大模型量化
gptq
Orchestra-Research/AI-Research-SKILLs
419
通过 GPTQ 的组束量化将大模型压缩到 4bit,在 RTX 4090/3090 等消费级 GPU 上实现 4 倍内存缩减、快速推理和 PEFT+QLoRA 兼容,便于部署与微调。
查看详情
LitGPT 大模型流水线
implementing-llms-litgpt
Orchestra-Research/AI-Research-SKILLs
143
LitGPT 提供 20+ 预训练大模型的单文件实现与完整训练流程,便于教学理解、LoRA/QLoRA 微调以及 Lightning AI 上的生产级训练。
查看详情
Llama 工厂微调指南
llama-factory
Orchestra-Research/AI-Research-SKILLs
378
基于 LLaMA-Factory,提供网页版无代码操作、QLoRA/LoRA 优化、多模态能力等大语言模型微调实战指导与参考资料,帮助开发者快速实践与调试。
查看详情
LoRA 参数高效微调
peft-fine-tuning
Orchestra-Research/AI-Research-SKILLs
344
介绍PEFT/LoRA/QLoRA在7B-70B大模型上的参数高效微调,涵盖低内存训练、<1%参数更新、多适配器与量化实战场景。
查看详情
LLM 量化工具包
quantizing-models-bitsandbytes
Orchestra-Research/AI-Research-SKILLs
243
将大模型量化至 8 位或 4 位,节省 50%~75% 显存,使受限 GPU 仍可执行推理与 QLoRA 微调,同时兼容 NF4/INT8、8 位优化器与 HuggingFace Transformers,保持高精度。
查看详情
Unsloth 快速微调指南
unsloth
Orchestra-Research/AI-Research-SKILLs
386
提供 Unsloth 快速微调方面的专家级指导,涵盖 API、最佳实践及 LoRA/QLoRA 性能优化,并指向详细参考文档与辅助脚本。
查看详情
1
语言
简体中文
English