登录
下载
Skill UI
浏览并发现
5160+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
吞吐
,共找到
4
条记录
默认排序
最新上传
最多下载
FAISS 向量相似搜索
faiss
Orchestra-Research/AI-Research-SKILLs
274
FAISS 是 Meta/ Facebook AI 的向量相似性搜索库,支持 Flat、IVF、HNSW 等索引、GPU 加速和亿量级向量检索,适用于高吞吐、低延迟的 k-NN 检索场景。
查看详情
Mistral 性能调优指南
mistral-performance-tuning
jeremylongshore/claude-code-plugins-plus-skills
134
指导团队通过选择合适模型、启用流式、缓存确定性请求、精简提示语和控制并发来降低 Mistral AI 的响应延迟并提升吞吐量。
查看详情
高吞吐量大模型服务
serving-llms-vllm
Orchestra-Research/AI-Research-SKILLs
284
使用 vLLM 的分页注意力、连续批处理、量化与张量并行等机制,在受限 GPU 内存下高效部署大模型服务,适合生产 API、离线批推理与高并发场景。
查看详情
TensorRT LLM 加速平台
tensorrt-llm
Orchestra-Research/AI-Research-SKILLs
376
在 NVIDIA GPU 上加速大语言模型推理,结合量化(FP8/INT4)、自动批处理和多卡扩展,实现高吞吐、低延迟的生产级服务,适合实时部署与 GPU 密集型场景。
查看详情
1
语言
简体中文
English