下载

Skill UI

浏览并发现 11148+ 精选技能

全部编程开发人工智能设计创意产品商业数据科学市场营销职场通用效率工具硬件工程语言学习

搜索微调，共找到 44 条记录

默认排序最新上传最多下载

迁移学习适配工具

adapting-transfer-learning-models

jeremylongshore/claude-code-plugins-plus-skills

自动化迁移学习流程，根据需求生成微调代码、验证数据、记录指标并保存产出，快速将预训练模型适配到新任务或数据集，提升性能与效率。

Axolotl大模型微调助手

Orchestra-Research/AI-Research-SKILLs

为 Axolotl 提供大模型微调指导，涵盖 YAML 配置、LoRA/QLoRA、DPO 等优化策略及多模态支持，适用于开发、调试和查阅文档。

Axolotl大模型微调助手

Orchestra-Research/AI-Research-SKILLs

为 Axolotl 提供大模型微调指导，涵盖 YAML 配置、LoRA/QLoRA、DPO 等优化策略及多模态支持，适用于开发、调试和查阅文档。

BLIP-2 视觉语言框架

blip-2-vision-language

Orchestra-Research/AI-Research-SKILLs

该框架将冻结的图像编码器与大语言模型连接，适用于图像描述、视觉问答、检索与多模态对话，在无需微调的条件下实现零样本推理，并仅训练轻量 Q-Former。

CLIP 视觉语言工具

Orchestra-Research/AI-Research-SKILLs

CLIP 借助预训练对比模型，在零样本图像分类、语义匹配、图像搜索和内容审核等视觉语言场景中无需微调即可部署。

LLM微调专家指南

fine-tuning-expert

Jeffallan/claude-skills

指导模型工程师完成数据准备、LoRA/QLoRA 适配器配置、训练监控、评估指标收集以及 Adapter 合并部署等 LLM 微调与量化的关键流程。

GPTQ LLM 量化指南

Orchestra-Research/AI-Research-SKILLs

GPTQ 提供后训练 4 位量化，可在 RTX 4090/3090 等消费级 GPU 上将大模型压缩至 1/4 内存并加速推理，同时维持低于 2% 的困惑度损失，适合部署和 QLoRA 微调。

GRPO强化学习微调

grpo-rl-training

Orchestra-Research/AI-Research-SKILLs

提供基于TRL的GRPO/RLHF训练实战经验，包含数据集预处理、奖励函数设计与结构化输出指导，适合需多目标对齐且缺乏偏好对的数据场景。

半二次量化方案

hqq-quantization

Orchestra-Research/AI-Research-SKILLs

提供无需校准数据即可将大模型权重量化至1位的流程，兼容 vLLM 与 HuggingFace，支持多种后端和 LoRA/PEFT 微调，适合快速部署与实验极限量化。

大型语言模型（LLM）实现与训练

implementing-llms-litgpt

Orchestra-Research/AI-Research-SKILLs

LitGPT提供了一个用于实现和训练超过20种前沿大型语言模型（如Llama, Gemma, Mistral）的工具。它支持完整的微调（Fine-tuning）、高效的LoRA适配以及从零开始的预训练流程。适用于需要清晰模型结构、学术理解或生产级部署的开发者。

LLaMA 工厂指南

Orchestra-Research/AI-Research-SKILLs

提供 llama-factory 的全面指南，通过 WebUI 无代码方式帮助微调大模型，涵盖 QLoRA/LoRA 量化、多模态和 HuggingFace 生态下的常见模型及调试技巧。

Mistral AI 自动化工作流

mistral-ai-automation

ComposioHQ/awesome-claude-skills

通过 Composio MCP 集成，自动化 Mistral AI 的文件上传、批处理、OCR、RAG 文档库管理以及微调任务跟踪，适合跨应用管道和智能代理预处理数据。

12 3 4 下一页

语言