登录
下载
Skill UI
浏览并发现
9765+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
大模型
,共找到
223
条记录
默认排序
最新上传
最多下载
GPTQ LLM 量化指南
gptq
Orchestra-Research/AI-Research-SKILLs
81
GPTQ 提供后训练 4 位量化,可在 RTX 4090/3090 等消费级 GPU 上将大模型压缩至 1/4 内存并加速推理,同时维持低于 2% 的困惑度损失,适合部署和 QLoRA 微调。
查看详情
Groq工作流:聊天、工具与结构化输出
groq-core-workflow-a
jeremylongshore/claude-code-plugins-plus-skills
128
本教程展示了如何利用 Groq API 实现高级大模型工作流。涵盖了基础聊天补全、通过工具调用(Function Calling)集成外部功能,以及使用JSON模式确保结构化输出。适用于构建高性能、实时响应的AI应用。
查看详情
Groq成本优化与管理
groq-cost-tuning
jeremylongshore/claude-code-plugins-plus-skills
424
本技能提供了一套全面的Groq API成本优化指南。内容涵盖了智能模型路由(为简单任务选择更小的模型)、最小化Token使用、批量处理请求以减少系统开销,以及实现缓存机制以提高效率。旨在帮助开发者在处理大流量AI工作负载时,实现显著的成本节约和系统性能提升。
查看详情
Groq企业级权限与成本管理
groq-enterprise-rbac
jeremylongshore/claude-code-plugins-plus-skills
399
本指南提供企业级LLM API调用(以Groq为例)的完整权限管理方案。它指导开发者如何实现多层级的RBAC,包括应用层级的模型访问控制、请求限流(Rate Limiting)和精细化的预算/成本跟踪,确保大型团队在调用大模型API时安全、合规且成本可控。
查看详情
Groq SDK 安装与认证配置
groq-install-auth
jeremylongshore/claude-code-plugins-plus-skills
326
本指南详细介绍了如何在Python和TypeScript环境中安装和配置Groq SDK。它涵盖了依赖安装、使用环境变量进行安全API密钥管理,并提供了连接验证代码示例。使用此流程可快速搭建与Groq超高速大模型推理API的连接,是所有基于Groq的项目起步必备步骤。
查看详情
Groq LLM模型迁移深度指南
groq-migration-deep-dive
jeremylongshore/claude-code-plugins-plus-skills
490
本指南详细介绍了如何将大型语言模型(LLM)集成从OpenAI、Anthropic等主流提供商平滑迁移到Groq。内容涵盖了SDK替换、模型ID映射、构建抽象层,以及使用功能开关实现零停机时间流量切换的完整技术流程,帮助开发者在保证服务连续性的同时,充分利用Groq的卓越推理速度。
查看详情
Groq API性能优化指南
groq-performance-tuning
jeremylongshore/claude-code-plugins-plus-skills
172
本技能旨在提供一套完整的Groq API性能优化方案。它指导用户如何根据应用需求选择最佳模型,实现语义缓存、流式传输、精简Prompt和并行请求,从而在需要极低延迟和高吞吐量的大规模应用场景中,充分挖掘Groq算力的潜力。
查看详情
Guidance 约束生成框架
guidance
Orchestra-Research/AI-Research-SKILLs
222
Guidance 通过正则、语法、选择约束等机制控制大模型输出,确保生成合法 JSON/XML/代码,规范日期邮件等格式,自动修复 Token 边界,并用 Python 式上下文管理构建多步工作流。
查看详情
半二次量化方案
hqq-quantization
Orchestra-Research/AI-Research-SKILLs
185
提供无需校准数据即可将大模型权重量化至1位的流程,兼容 vLLM 与 HuggingFace,支持多种后端和 LoRA/PEFT 微调,适合快速部署与实验极限量化。
查看详情
Hugging Face云工作流执行
hugging-face-jobs
sickn33/antigravity-awesome-skills
155
用于在Hugging Face的托管云基础设施上执行复杂的计算工作负载。无需本地环境配置,支持使用云端的CPU、GPU或TPU资源。适用于大规模数据处理、批处理推理、可复现的模型训练和周期性自动化任务,并将结果持久化到Hugging Face Hub。
查看详情
优化 Ideogram API 成本
ideogram-cost-tuning
jeremylongshore/claude-code-plugins-plus-skills
341
本技能提供了一套完整的 Ideogram API 成本优化方案。它指导用户通过模型分级选择、批量调用、缓存提示词和设置预算监控,极大地降低图像生成成本。适用于需要进行大规模、高频率 AI 图像创作的开发者。
查看详情
Ideogram API性能调优
ideogram-performance-tuning
jeremylongshore/claude-code-plugins-plus-skills
364
本技能集提供了一套完整的Ideogram API性能调优方案。它指导用户根据需求选择最佳的模型和速度等级,通过实现基于提示词的缓存机制避免重复调用,并利用并发队列管理大规模图片的高效并行生成。最后,还展示了与AWS S3等CDN服务的集成,极大提升了整个工作流的效率和吞吐量。
查看详情
上一页
1
2
3
4
5
6
...
17
18
19
下一页
语言
简体中文
English