登录
下载
Skill UI
浏览并发现
9688+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
高性能
,共找到
24
条记录
默认排序
最新上传
最多下载
GGUF量化:高效大模型推理
gguf-quantization
Orchestra-Research/AI-Research-SKILLs
403
本指南深入介绍GGUF格式和模型量化技术,旨在实现大语言模型(LLM)在消费级硬件上的高效推理。通过采用GGUF标准格式和K-quant方法进行模型压缩,可以显著降低内存和硬件要求,使开发者能够在Apple Silicon、CPU或边缘设备上部署高性能AI应用。
查看详情
Groq工作流:聊天、工具与结构化输出
groq-core-workflow-a
jeremylongshore/claude-code-plugins-plus-skills
128
本教程展示了如何利用 Groq API 实现高级大模型工作流。涵盖了基础聊天补全、通过工具调用(Function Calling)集成外部功能,以及使用JSON模式确保结构化输出。适用于构建高性能、实时响应的AI应用。
查看详情
Groq API 聊天补全指南
groq-hello-world
jeremylongshore/claude-code-plugins-plus-skills
466
本指南全面介绍了如何使用Groq的高速LPU进行聊天补全。内容包含TypeScript和Python代码示例,涵盖了基础聊天交互、流式响应处理,以及多模态和不同性能级别的模型使用。适用于希望快速构建高性能、低延迟AI应用的开发者。
查看详情
GroqCloud 自动化套件
groqcloud-automation
ComposioHQ/awesome-claude-skills
302
GroqCloud 自动化通过 Composio 调度高性能 API,涵盖推理、聊天输出、音频翻译与 TTS 语音选择,适合构建生产级 AI 流程。
查看详情
CPU/边缘本地大模型推理
llama-cpp
Orchestra-Research/AI-Research-SKILLs
180
llama.cpp是一个纯C/C++编写的轻量级推理框架,专为在资源受限的设备上运行大型语言模型(LLM)而设计。它特别适用于没有高性能NVIDIA GPU(CUDA)的场景,非常适合Apple Silicon、AMD/Intel GPU以及边缘计算设备。通过支持GGUF量化,可以实现内存占用和推理速度的显著优化,支持本地跨平台部署。
查看详情
Mergekit 模型融合实战
model-merging
Orchestra-Research/AI-Research-SKILLs
120
通过 Mergekit 在无需重训的前提下融合多个微调模型,交叉叠加数学、编程与对话能力,涵盖 SLERP、TIES、DARE、任务算术与线性融合,助力快速打造高性能多技能模型并部署。
查看详情
OpenRLHF训练套件
openrlhf-training
Orchestra-Research/AI-Research-SKILLs
474
一个基于Ray和vLLM的高性能RLHF训练框架,兼容PPO、GRPO、RLOO、DPO,借助ZeRO-3与分布式架构在多GPU集群上加速7B-70B+大模型的策略与奖励优化流程。
查看详情
Perplexity云平台部署集成指南
perplexity-deploy-integration
jeremylongshore/claude-code-plugins-plus-skills
244
本指南提供了使用 Perplexity Sonar API 构建和部署应用的完整流程。涵盖了 Vercel、Cloud Run 和 Docker 等主流云平台的部署配置,支持构建生产就绪的API端点。用户可以管理API密钥、利用边缘函数和Redis缓存,确保应用在高可用性和高性能方面达到最佳效果。
查看详情
高性能向量相似性搜索引擎
qdrant-vector-search
Orchestra-Research/AI-Research-SKILLs
90
Qdrant是一个高性能的Rust驱动向量数据库,专为生产级的RAG(检索增强生成)和语义搜索应用设计。它提供快速的最近邻搜索功能,支持结合元数据的混合搜索,并具备通过分片和复制实现的水平扩展能力。适用于构建实时推荐系统和企业级知识检索系统。
查看详情
SGLang 结构化推理服务
sglang
Orchestra-Research/AI-Research-SKILLs
150
SGLang 是面向 LLM/VLM 的高性能服务框架,采用 RadixAttention 前缀缓存实现 JSON/正则/语法结构化输出、函数调用型代理流程,并在多 GPU 生产环境中比 vLLM 快 5 倍。
查看详情
稳定扩散图像生成指南
stable-diffusion-image-generation
Orchestra-Research/AI-Research-SKILLs
489
本指南全面介绍了如何使用HuggingFace Diffusers库和Stable Diffusion模型进行高级图像生成。用户可以实现从文本描述生成图像(Text-to-Image)、图像到图像的风格迁移、局部重绘(Inpainting)以及图像扩展等功能。适用于需要高性能、高保真度和可定制化工作流的创意或计算机视觉应用场景。
查看详情
高性能强化学习框架
pufferlib
K-Dense-AI/claude-scientific-skills
205
PufferLib是一个高性能的强化学习框架,专为大规模、高速的RL训练和仿真而设计。它通过优化的向量化和原生多智能体支持,实现了每秒数百万步的训练速度,极大地提升了RL研究和应用效率,适用于单智能体和多智能体环境的构建与训练。
查看详情
1
2
下一页
语言
简体中文
English