下载

Skill UI

浏览并发现 10574+ 精选技能

全部编程开发人工智能设计创意产品商业数据科学市场营销职场通用效率工具硬件工程语言学习

搜索 QLoRA ，共找到 9 条记录

默认排序最新上传最多下载

Axolotl大模型微调助手

Orchestra-Research/AI-Research-SKILLs

为 Axolotl 提供大模型微调指导，涵盖 YAML 配置、LoRA/QLoRA、DPO 等优化策略及多模态支持，适用于开发、调试和查阅文档。

Axolotl大模型微调助手

Orchestra-Research/AI-Research-SKILLs

为 Axolotl 提供大模型微调指导，涵盖 YAML 配置、LoRA/QLoRA、DPO 等优化策略及多模态支持，适用于开发、调试和查阅文档。

LLM微调专家指南

fine-tuning-expert

Jeffallan/claude-skills

指导模型工程师完成数据准备、LoRA/QLoRA 适配器配置、训练监控、评估指标收集以及 Adapter 合并部署等 LLM 微调与量化的关键流程。

GPTQ LLM 量化指南

Orchestra-Research/AI-Research-SKILLs

GPTQ 提供后训练 4 位量化，可在 RTX 4090/3090 等消费级 GPU 上将大模型压缩至 1/4 内存并加速推理，同时维持低于 2% 的困惑度损失，适合部署和 QLoRA 微调。

大型语言模型（LLM）实现与训练

implementing-llms-litgpt

Orchestra-Research/AI-Research-SKILLs

LitGPT提供了一个用于实现和训练超过20种前沿大型语言模型（如Llama, Gemma, Mistral）的工具。它支持完整的微调（Fine-tuning）、高效的LoRA适配以及从零开始的预训练流程。适用于需要清晰模型结构、学术理解或生产级部署的开发者。

LLaMA 工厂指南

Orchestra-Research/AI-Research-SKILLs

提供 llama-factory 的全面指南，通过 WebUI 无代码方式帮助微调大模型，涵盖 QLoRA/LoRA 量化、多模态和 HuggingFace 生态下的常见模型及调试技巧。

PEFT 高效微调指南

peft-fine-tuning

Orchestra-Research/AI-Research-SKILLs

介绍 HuggingFace PEFT 中 LoRA/QLoRA 微调流程，帮助在有限 GPU 上只训练小于 1% 参数并高效管理多适配器部署。

LLM 量化优化工具

quantizing-models-bitsandbytes

Orchestra-Research/AI-Research-SKILLs

使用 bitsandbytes 将 HuggingFace 大模型量化到 8 位或 4 位，显存降低 50%-75%，并兼容 QLoRA 以及 8 位优化器，适合显存受限时快速部署与训练。

Unsloth 快速微调指南

Orchestra-Research/AI-Research-SKILLs

Unsloth 技能提供快速微调指导，涵盖 LoRA/QLoRA、内存优化、接口实用和调试建议，帮助开发者高效构建定制模型。

1

语言