登录
下载
Skill UI
浏览并发现
5988+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
多模型
,共找到
56
条记录
默认排序
最新上传
最多下载
激活感知权重量化
awq-quantization
Orchestra-Research/AI-Research-SKILLs
151
AWQ 通过激活感知的 4-bit 权重量化,在有限 GPU 内存、使用 vLLM 或 Marlin 内核时,为指令调优或多模态大模型提供约 3 倍推理加速且误差低于 5%。
查看详情
Axolotl 微调指南
axolotl
Orchestra-Research/AI-Research-SKILLs
498
引导开发者使用 Axolotl 对大型模型进行微调,包含 YAML 配置示例、LoRA/QLoRA 与 DPO/KTO/ORPO/GRPO 流程、FSDP 参数建议、压缩检查点与调试技巧,适用于多模态训练场景。
查看详情
Axolotl 微调指南
axolotl
Orchestra-Research/AI-Research-SKILLs
498
引导开发者使用 Axolotl 对大型模型进行微调,包含 YAML 配置示例、LoRA/QLoRA 与 DPO/KTO/ORPO/GRPO 流程、FSDP 参数建议、压缩检查点与调试技巧,适用于多模态训练场景。
查看详情
BLIP-2 视觉语言预训练
blip-2-vision-language
Orchestra-Research/AI-Research-SKILLs
375
BLIP-2 将冻结图像编码器与大语言模型连接为视觉语言预训练框架,可用于高质量图像描述、视觉问答、图文检索或零样本多模态对话。
查看详情
成本感知型 LLM 流水线
cost-aware-llm-pipeline
affaan-m/everything-claude-code
260
将模型路由、预算追踪、重试策略与提示缓存组合成可复用流水线,帮助多模型批处理在保障质量的同时控制 Claude/GPT 等 LLM API 的支出。
查看详情
嵌入策略指南
embedding-strategies
sickn33/antigravity-awesome-skills
51
指导团队选择与调优嵌入模型、分块与管道,覆盖 RAG、多语种输入和降维等向量搜索场景。
查看详情
代码模型基准评测
evaluating-code-models
Orchestra-Research/AI-Research-SKILLs
436
使用 BigCode 评测工具在 HumanEval、MBPP、MultiPL-E 等 15+ 基准上跑 pass@k 指标,用于比较代码模型的生成质量、多语言支持以及量化或指令调优版本的表现。
查看详情
LLM 评估工具套件
evaluating-llms-harness
Orchestra-Research/AI-Research-SKILLs
343
通过 lm-evaluation-harness 在 MMLU、HumanEval、GSM8K 等 60 多个学术基准上,对 HuggingFace/vLLM/API 模型进行对比评测、训练追踪并输出统一报告,适合实验室发布与质量监控。
查看详情
Gemini API 集成指南
gemini-api-dev
sickn33/antigravity-awesome-skills
407
指导开发者通过 Google 的 Gemini API 调用高级多模态模型,涵盖 SDK 安装与迁移、Python/JS/Go 示例代码,以及 REST 规范与文档索引(文本、图像、函数调用等)在集成和调试中的应用场景。
查看详情
Groq 企业级权限管理
groq-enterprise-rbac
jeremylongshore/claude-code-plugins-plus-skills
404
指导如何配置 Groq 企业单点登录、令牌权限、组织级治理以及模型访问控制、限流、预算阈值和密钥轮换,保障多个团队安全接入超快 LPU 推理 API。
查看详情
Groq 多环境部署配置
groq-multi-env-setup
jeremylongshore/claude-code-plugins-plus-skills
160
为 Groq LLM 提供开发、预发布和生产三端的定制配置,结合模型选择、重试与限流策略,确保各环境部署既稳定又高效。
查看详情
半二次量化模型
hqq-quantization
Orchestra-Research/AI-Research-SKILLs
160
HQQ 提供无需校准数据的半二次量化,支持 1-8 位、可配置多个推理后端(PyTorch、TorchAO、BitBlas、Marlin),适合极速量化流程、零数据部署及 HuggingFace/vLLM 上的 PEFT/LoRA 微调。
查看详情
1
2
3
4
5
下一页
语言
简体中文
English