登录
下载
Skill UI
浏览并发现
9688+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
微调
,共找到
39
条记录
默认排序
最新上传
最多下载
迁移学习适配工具
adapting-transfer-learning-models
jeremylongshore/claude-code-plugins-plus-skills
451
自动化迁移学习流程,根据需求生成微调代码、验证数据、记录指标并保存产出,快速将预训练模型适配到新任务或数据集,提升性能与效率。
查看详情
Axolotl大模型微调助手
axolotl
Orchestra-Research/AI-Research-SKILLs
241
为 Axolotl 提供大模型微调指导,涵盖 YAML 配置、LoRA/QLoRA、DPO 等优化策略及多模态支持,适用于开发、调试和查阅文档。
查看详情
Axolotl大模型微调助手
axolotl
Orchestra-Research/AI-Research-SKILLs
241
为 Axolotl 提供大模型微调指导,涵盖 YAML 配置、LoRA/QLoRA、DPO 等优化策略及多模态支持,适用于开发、调试和查阅文档。
查看详情
BLIP-2 视觉语言框架
blip-2-vision-language
Orchestra-Research/AI-Research-SKILLs
239
该框架将冻结的图像编码器与大语言模型连接,适用于图像描述、视觉问答、检索与多模态对话,在无需微调的条件下实现零样本推理,并仅训练轻量 Q-Former。
查看详情
CLIP 视觉语言工具
clip
Orchestra-Research/AI-Research-SKILLs
142
CLIP 借助预训练对比模型,在零样本图像分类、语义匹配、图像搜索和内容审核等视觉语言场景中无需微调即可部署。
查看详情
LLM微调专家指南
fine-tuning-expert
Jeffallan/claude-skills
454
指导模型工程师完成数据准备、LoRA/QLoRA 适配器配置、训练监控、评估指标收集以及 Adapter 合并部署等 LLM 微调与量化的关键流程。
查看详情
GPTQ LLM 量化指南
gptq
Orchestra-Research/AI-Research-SKILLs
81
GPTQ 提供后训练 4 位量化,可在 RTX 4090/3090 等消费级 GPU 上将大模型压缩至 1/4 内存并加速推理,同时维持低于 2% 的困惑度损失,适合部署和 QLoRA 微调。
查看详情
GRPO强化学习微调
grpo-rl-training
Orchestra-Research/AI-Research-SKILLs
416
提供基于TRL的GRPO/RLHF训练实战经验,包含数据集预处理、奖励函数设计与结构化输出指导,适合需多目标对齐且缺乏偏好对的数据场景。
查看详情
半二次量化方案
hqq-quantization
Orchestra-Research/AI-Research-SKILLs
185
提供无需校准数据即可将大模型权重量化至1位的流程,兼容 vLLM 与 HuggingFace,支持多种后端和 LoRA/PEFT 微调,适合快速部署与实验极限量化。
查看详情
大型语言模型(LLM)实现与训练
implementing-llms-litgpt
Orchestra-Research/AI-Research-SKILLs
376
LitGPT提供了一个用于实现和训练超过20种前沿大型语言模型(如Llama, Gemma, Mistral)的工具。它支持完整的微调(Fine-tuning)、高效的LoRA适配以及从零开始的预训练流程。适用于需要清晰模型结构、学术理解或生产级部署的开发者。
查看详情
LLaMA 工厂指南
llama-factory
Orchestra-Research/AI-Research-SKILLs
108
提供 llama-factory 的全面指南,通过 WebUI 无代码方式帮助微调大模型,涵盖 QLoRA/LoRA 量化、多模态和 HuggingFace 生态下的常见模型及调试技巧。
查看详情
Mistral AI 自动化工作流
mistral-ai-automation
ComposioHQ/awesome-claude-skills
176
通过 Composio MCP 集成,自动化 Mistral AI 的文件上传、批处理、OCR、RAG 文档库管理以及微调任务跟踪,适合跨应用管道和智能代理预处理数据。
查看详情
1
2
3
4
下一页
语言
简体中文
English