登录
下载
Skill UI
浏览并发现
9979+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
吞吐量
,共找到
10
条记录
默认排序
最新上传
最多下载
多智能体系统优化工具
agent-orchestration-multi-agent-optimize
sickn33/antigravity-awesome-skills
165
这是一个先进的人工智能驱动框架,用于进行多智能体系统的整体性能工程优化。它提供协调的性能分析、工作负载分配和成本感知编排,覆盖数据库、应用层和前端等多个领域。可用于识别系统瓶颈,提高吞吐量,增强复杂智能体工作流的可靠性和效率。
查看详情
FAISS:高效向量相似性搜索库
faiss
Orchestra-Research/AI-Research-SKILLs
276
FAISS(Facebook AI Similarity Search)是一个用于高效相似性搜索和聚类的库。它支持对数十亿级别的密集向量进行索引和搜索,具备GPU加速和多种索引类型(如Flat、IVF、HNSW)。适用于构建需要超高吞吐量和低延迟的超大规模应用,特别是在RAG、推荐系统等领域,用于快速的k-NN检索或纯向量相似度匹配。
查看详情
Mistral AI API性能调优指南
mistral-performance-tuning
jeremylongshore/claude-code-plugins-plus-skills
65
本指南提供一套全面的Mistral AI API性能优化框架。内容涵盖模型选型、响应流式传输(Streaming)、请求缓存、并发控制到提示词优化等高级技术。帮助开发者解决API响应慢、吞吐量不足等问题,实现高效、低延迟、高稳定性的AI应用集成,是构建生产级AI系统的必备知识。
查看详情
TensorRT LLM 推理优化
tensorrt-llm
Orchestra-Research/AI-Research-SKILLs
334
在 NVIDIA GPU 上使用 TensorRT 优化大模型推理,支持 FP8/INT4 量化、多 GPU 扩展及高吞吐量部署,适合实时与生产环境。
查看详情
ElevenLabs TTS性能优化指南
elevenlabs-performance-tuning
jeremylongshore/claude-code-plugins-plus-skills
469
本指南提供了优化ElevenLabs TTS性能的完整技术方案。内容涵盖了如何通过模型选择(如Flash模型)、利用流媒体(Streaming)接口以及优化音频格式,来显著降低语音生成延迟和提高数据吞吐量。适用于实时对话、IVR系统和高并发的语音内容生成场景。
查看详情
AssemblyAI转录性能优化指南
assemblyai-performance-tuning
jeremylongshore/claude-code-plugins-plus-skills
62
本指南提供了优化AssemblyAI转录性能的全面高级策略。涵盖了如何最大化处理吞吐量和最小化延迟,指导用户实现缓存机制、使用Webhook替代轮询、根据需求选择最佳模型,以及高效并行处理大规模批次任务。
查看详情
语音转写速率限制处理
assemblyai-rate-limits
jeremylongshore/claude-code-plugins-plus-skills
317
本技能提供处理AssemblyAI API速率限制和限流的完整解决方案。它集成了指数退避、抖动算法、队列并发控制等高级模式,适用于构建需要处理大量音频数据流、要求高可靠性和高吞吐量的语音转写系统。
查看详情
Cohere API性能调优指南
cohere-performance-tuning
jeremylongshore/claude-code-plugins-plus-skills
466
本指南提供全面的Cohere API v2性能优化策略。旨在帮助用户优化Chat、Embed和Rerank等核心API的使用效率,显著提高API吞吐量、降低延迟和管理成本。核心技术包括根据延迟预算选择最佳模型、实现流式传输(Streaming)以提升用户体验、高效批量嵌入(Batching)处理、向量压缩以及部署缓存机制。
查看详情
Qdrant性能优化指南
qdrant-performance-optimization
github/awesome-copilot
438
本指南提供了全面的Qdrant性能优化策略。内容涵盖了搜索速度(包括延迟和吞吐量)、高效的向量索引构建、以及内存使用管理等关键方面。适用于需要提升向量数据库运行速度、可扩展性和资源利用率的场景。
查看详情
Qdrant向量搜索性能优化指南
qdrant-search-speed-optimization
github/awesome-copilot
173
本指南详细介绍了Qdrant向量搜索的性能诊断与优化方法,解决搜索速度慢、延迟高或吞吐量不足的问题。内容涵盖了从内存优化、HNSW参数调优、量化技术到高效索引创建等多个方面,帮助用户提升系统在高负载下的检索效率。
查看详情
1
语言
简体中文
English