下载

Skill UI

浏览并发现 9765+ 精选技能

全部编程开发人工智能设计创意产品商业数据科学市场营销职场通用效率工具硬件工程语言学习

搜索大模型，共找到 223 条记录

默认排序最新上传最多下载

GPTQ LLM 量化指南

Orchestra-Research/AI-Research-SKILLs

GPTQ 提供后训练 4 位量化，可在 RTX 4090/3090 等消费级 GPU 上将大模型压缩至 1/4 内存并加速推理，同时维持低于 2% 的困惑度损失，适合部署和 QLoRA 微调。

Groq工作流：聊天、工具与结构化输出

groq-core-workflow-a

jeremylongshore/claude-code-plugins-plus-skills

本教程展示了如何利用 Groq API 实现高级大模型工作流。涵盖了基础聊天补全、通过工具调用（Function Calling）集成外部功能，以及使用JSON模式确保结构化输出。适用于构建高性能、实时响应的AI应用。

Groq成本优化与管理

groq-cost-tuning

jeremylongshore/claude-code-plugins-plus-skills

本技能提供了一套全面的Groq API成本优化指南。内容涵盖了智能模型路由（为简单任务选择更小的模型）、最小化Token使用、批量处理请求以减少系统开销，以及实现缓存机制以提高效率。旨在帮助开发者在处理大流量AI工作负载时，实现显著的成本节约和系统性能提升。

Groq企业级权限与成本管理

groq-enterprise-rbac

jeremylongshore/claude-code-plugins-plus-skills

本指南提供企业级LLM API调用（以Groq为例）的完整权限管理方案。它指导开发者如何实现多层级的RBAC，包括应用层级的模型访问控制、请求限流（Rate Limiting）和精细化的预算/成本跟踪，确保大型团队在调用大模型API时安全、合规且成本可控。

Groq SDK 安装与认证配置

groq-install-auth

jeremylongshore/claude-code-plugins-plus-skills

本指南详细介绍了如何在Python和TypeScript环境中安装和配置Groq SDK。它涵盖了依赖安装、使用环境变量进行安全API密钥管理，并提供了连接验证代码示例。使用此流程可快速搭建与Groq超高速大模型推理API的连接，是所有基于Groq的项目起步必备步骤。

Groq LLM模型迁移深度指南

groq-migration-deep-dive

jeremylongshore/claude-code-plugins-plus-skills

本指南详细介绍了如何将大型语言模型（LLM）集成从OpenAI、Anthropic等主流提供商平滑迁移到Groq。内容涵盖了SDK替换、模型ID映射、构建抽象层，以及使用功能开关实现零停机时间流量切换的完整技术流程，帮助开发者在保证服务连续性的同时，充分利用Groq的卓越推理速度。

Groq API性能优化指南

groq-performance-tuning

jeremylongshore/claude-code-plugins-plus-skills

本技能旨在提供一套完整的Groq API性能优化方案。它指导用户如何根据应用需求选择最佳模型，实现语义缓存、流式传输、精简Prompt和并行请求，从而在需要极低延迟和高吞吐量的大规模应用场景中，充分挖掘Groq算力的潜力。

Guidance 约束生成框架

Orchestra-Research/AI-Research-SKILLs

Guidance 通过正则、语法、选择约束等机制控制大模型输出，确保生成合法 JSON/XML/代码，规范日期邮件等格式，自动修复 Token 边界，并用 Python 式上下文管理构建多步工作流。

半二次量化方案

hqq-quantization

Orchestra-Research/AI-Research-SKILLs

提供无需校准数据即可将大模型权重量化至1位的流程，兼容 vLLM 与 HuggingFace，支持多种后端和 LoRA/PEFT 微调，适合快速部署与实验极限量化。

Hugging Face云工作流执行

hugging-face-jobs

sickn33/antigravity-awesome-skills

用于在Hugging Face的托管云基础设施上执行复杂的计算工作负载。无需本地环境配置，支持使用云端的CPU、GPU或TPU资源。适用于大规模数据处理、批处理推理、可复现的模型训练和周期性自动化任务，并将结果持久化到Hugging Face Hub。

优化 Ideogram API 成本

ideogram-cost-tuning

jeremylongshore/claude-code-plugins-plus-skills

本技能提供了一套完整的 Ideogram API 成本优化方案。它指导用户通过模型分级选择、批量调用、缓存提示词和设置预算监控，极大地降低图像生成成本。适用于需要进行大规模、高频率 AI 图像创作的开发者。

Ideogram API性能调优

ideogram-performance-tuning

jeremylongshore/claude-code-plugins-plus-skills

本技能集提供了一套完整的Ideogram API性能调优方案。它指导用户根据需求选择最佳的模型和速度等级，通过实现基于提示词的缓存机制避免重复调用，并利用并发队列管理大规模图片的高效并行生成。最后，还展示了与AWS S3等CDN服务的集成，极大提升了整个工作流的效率和吞吐量。

上一页 1 234 5 6...17 18 19 下一页

语言