下载

Skill UI

浏览并发现 5988+ 精选技能

全部编程开发人工智能设计创意产品商业数据科学市场营销职场通用效率工具硬件工程语言学习

搜索多模型，共找到 56 条记录

默认排序最新上传最多下载

激活感知权重量化

awq-quantization

Orchestra-Research/AI-Research-SKILLs

AWQ 通过激活感知的 4-bit 权重量化，在有限 GPU 内存、使用 vLLM 或 Marlin 内核时，为指令调优或多模态大模型提供约 3 倍推理加速且误差低于 5%。

Axolotl 微调指南

Orchestra-Research/AI-Research-SKILLs

引导开发者使用 Axolotl 对大型模型进行微调，包含 YAML 配置示例、LoRA/QLoRA 与 DPO/KTO/ORPO/GRPO 流程、FSDP 参数建议、压缩检查点与调试技巧，适用于多模态训练场景。

Axolotl 微调指南

Orchestra-Research/AI-Research-SKILLs

引导开发者使用 Axolotl 对大型模型进行微调，包含 YAML 配置示例、LoRA/QLoRA 与 DPO/KTO/ORPO/GRPO 流程、FSDP 参数建议、压缩检查点与调试技巧，适用于多模态训练场景。

BLIP-2 视觉语言预训练

blip-2-vision-language

Orchestra-Research/AI-Research-SKILLs

BLIP-2 将冻结图像编码器与大语言模型连接为视觉语言预训练框架，可用于高质量图像描述、视觉问答、图文检索或零样本多模态对话。

成本感知型 LLM 流水线

cost-aware-llm-pipeline

affaan-m/everything-claude-code

将模型路由、预算追踪、重试策略与提示缓存组合成可复用流水线，帮助多模型批处理在保障质量的同时控制 Claude/GPT 等 LLM API 的支出。

嵌入策略指南

embedding-strategies

sickn33/antigravity-awesome-skills

指导团队选择与调优嵌入模型、分块与管道，覆盖 RAG、多语种输入和降维等向量搜索场景。

代码模型基准评测

evaluating-code-models

Orchestra-Research/AI-Research-SKILLs

使用 BigCode 评测工具在 HumanEval、MBPP、MultiPL-E 等 15+ 基准上跑 pass@k 指标，用于比较代码模型的生成质量、多语言支持以及量化或指令调优版本的表现。

LLM 评估工具套件

evaluating-llms-harness

Orchestra-Research/AI-Research-SKILLs

通过 lm-evaluation-harness 在 MMLU、HumanEval、GSM8K 等 60 多个学术基准上，对 HuggingFace/vLLM/API 模型进行对比评测、训练追踪并输出统一报告，适合实验室发布与质量监控。

Gemini API 集成指南

sickn33/antigravity-awesome-skills

指导开发者通过 Google 的 Gemini API 调用高级多模态模型，涵盖 SDK 安装与迁移、Python/JS/Go 示例代码，以及 REST 规范与文档索引（文本、图像、函数调用等）在集成和调试中的应用场景。

Groq 企业级权限管理

groq-enterprise-rbac

jeremylongshore/claude-code-plugins-plus-skills

指导如何配置 Groq 企业单点登录、令牌权限、组织级治理以及模型访问控制、限流、预算阈值和密钥轮换，保障多个团队安全接入超快 LPU 推理 API。

Groq 多环境部署配置

groq-multi-env-setup

jeremylongshore/claude-code-plugins-plus-skills

为 Groq LLM 提供开发、预发布和生产三端的定制配置，结合模型选择、重试与限流策略，确保各环境部署既稳定又高效。

半二次量化模型

hqq-quantization

Orchestra-Research/AI-Research-SKILLs

HQQ 提供无需校准数据的半二次量化，支持 1-8 位、可配置多个推理后端（PyTorch、TorchAO、BitBlas、Marlin），适合极速量化流程、零数据部署及 HuggingFace/vLLM 上的 PEFT/LoRA 微调。

12 3 4 5 下一页

语言