下载

Skill UI

浏览并发现 9688+ 精选技能

全部编程开发人工智能设计创意产品商业数据科学市场营销职场通用效率工具硬件工程语言学习

搜索高性能，共找到 24 条记录

默认排序最新上传最多下载

GGUF量化：高效大模型推理

gguf-quantization

Orchestra-Research/AI-Research-SKILLs

本指南深入介绍GGUF格式和模型量化技术，旨在实现大语言模型（LLM）在消费级硬件上的高效推理。通过采用GGUF标准格式和K-quant方法进行模型压缩，可以显著降低内存和硬件要求，使开发者能够在Apple Silicon、CPU或边缘设备上部署高性能AI应用。

Groq工作流：聊天、工具与结构化输出

groq-core-workflow-a

jeremylongshore/claude-code-plugins-plus-skills

本教程展示了如何利用 Groq API 实现高级大模型工作流。涵盖了基础聊天补全、通过工具调用（Function Calling）集成外部功能，以及使用JSON模式确保结构化输出。适用于构建高性能、实时响应的AI应用。

Groq API 聊天补全指南

groq-hello-world

jeremylongshore/claude-code-plugins-plus-skills

本指南全面介绍了如何使用Groq的高速LPU进行聊天补全。内容包含TypeScript和Python代码示例，涵盖了基础聊天交互、流式响应处理，以及多模态和不同性能级别的模型使用。适用于希望快速构建高性能、低延迟AI应用的开发者。

GroqCloud 自动化套件

groqcloud-automation

ComposioHQ/awesome-claude-skills

GroqCloud 自动化通过 Composio 调度高性能 API，涵盖推理、聊天输出、音频翻译与 TTS 语音选择，适合构建生产级 AI 流程。

CPU/边缘本地大模型推理

Orchestra-Research/AI-Research-SKILLs

llama.cpp是一个纯C/C++编写的轻量级推理框架，专为在资源受限的设备上运行大型语言模型（LLM）而设计。它特别适用于没有高性能NVIDIA GPU（CUDA）的场景，非常适合Apple Silicon、AMD/Intel GPU以及边缘计算设备。通过支持GGUF量化，可以实现内存占用和推理速度的显著优化，支持本地跨平台部署。

Mergekit 模型融合实战

Orchestra-Research/AI-Research-SKILLs

通过 Mergekit 在无需重训的前提下融合多个微调模型，交叉叠加数学、编程与对话能力，涵盖 SLERP、TIES、DARE、任务算术与线性融合，助力快速打造高性能多技能模型并部署。

OpenRLHF训练套件

openrlhf-training

Orchestra-Research/AI-Research-SKILLs

一个基于Ray和vLLM的高性能RLHF训练框架，兼容PPO、GRPO、RLOO、DPO，借助ZeRO-3与分布式架构在多GPU集群上加速7B-70B+大模型的策略与奖励优化流程。

Perplexity云平台部署集成指南

perplexity-deploy-integration

jeremylongshore/claude-code-plugins-plus-skills

本指南提供了使用 Perplexity Sonar API 构建和部署应用的完整流程。涵盖了 Vercel、Cloud Run 和 Docker 等主流云平台的部署配置，支持构建生产就绪的API端点。用户可以管理API密钥、利用边缘函数和Redis缓存，确保应用在高可用性和高性能方面达到最佳效果。

高性能向量相似性搜索引擎

qdrant-vector-search

Orchestra-Research/AI-Research-SKILLs

Qdrant是一个高性能的Rust驱动向量数据库，专为生产级的RAG（检索增强生成）和语义搜索应用设计。它提供快速的最近邻搜索功能，支持结合元数据的混合搜索，并具备通过分片和复制实现的水平扩展能力。适用于构建实时推荐系统和企业级知识检索系统。

SGLang 结构化推理服务

Orchestra-Research/AI-Research-SKILLs

SGLang 是面向 LLM/VLM 的高性能服务框架，采用 RadixAttention 前缀缓存实现 JSON/正则/语法结构化输出、函数调用型代理流程，并在多 GPU 生产环境中比 vLLM 快 5 倍。

稳定扩散图像生成指南

stable-diffusion-image-generation

Orchestra-Research/AI-Research-SKILLs

本指南全面介绍了如何使用HuggingFace Diffusers库和Stable Diffusion模型进行高级图像生成。用户可以实现从文本描述生成图像（Text-to-Image）、图像到图像的风格迁移、局部重绘（Inpainting）以及图像扩展等功能。适用于需要高性能、高保真度和可定制化工作流的创意或计算机视觉应用场景。

高性能强化学习框架

K-Dense-AI/claude-scientific-skills

PufferLib是一个高性能的强化学习框架，专为大规模、高速的RL训练和仿真而设计。它通过优化的向量化和原生多智能体支持，实现了每秒数百万步的训练速度，极大地提升了RL研究和应用效率，适用于单智能体和多智能体环境的构建与训练。

语言