登录
下载
Skill UI
浏览并发现
6034+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
延迟
,共找到
22
条记录
默认排序
最新上传
最多下载
Deepgram 性能调优指南
deepgram-performance-tuning
jeremylongshore/claude-code-plugins-plus-skills
294
针对 Deepgram 转录,指引如何做音频预处理、连接池、模型选择、流式传输、并发控制与缓存策略,从而提升速度、降低延迟,适用于高负载语音管道。
查看详情
FAISS 向量相似搜索
faiss
Orchestra-Research/AI-Research-SKILLs
274
FAISS 是 Meta/ Facebook AI 的向量相似性搜索库,支持 Flat、IVF、HNSW 等索引、GPU 加速和亿量级向量检索,适用于高吞吐、低延迟的 k-NN 检索场景。
查看详情
Groq参考架构指南
groq-reference-architecture
jeremylongshore/claude-code-plugins-plus-skills
54
提供 Groq LPU 生产级架构指南,讲解模型分层路由、流式流水线、降级策略与监控,便于设计低延迟实时 AI 应用。
查看详情
推理延迟分析器
inference-latency-profiler
jeremylongshore/claude-code-plugins-plus-skills
208
本技能自动处理推理延迟分析器相关任务,在 ML 部署场景中提供模型服务、MLOps 管道、监控和生产优化等按步骤指导,生成生产级代码并校验输出标准,助力快速完成推理性能调优。
查看详情
LLM 可观测性追踪
langfuse
sickn33/antigravity-awesome-skills
166
通过 Langfuse 在 LLM 应用中记录 trace、prompt 版本、评估和性能数据,便于监控成本、延迟与质量并持续优化。
查看详情
Langfuse 监控与告警体系
langfuse-observability
jeremylongshore/claude-code-plugins-plus-skills
281
为 Langfuse 集成构建 Prometheus 指标、Grafana 看板和 AlertManager 告警,监测 LLM 操作的请求率、延迟、成本与错误,确保链路健康和预算可控。
查看详情
Mistral 可观测平台
mistral-observability
jeremylongshore/claude-code-plugins-plus-skills
178
为 Mistral AI 集成建立指标、日志、告警与成本追踪,确保请求速率、延迟、token 消耗及异常情况可视化并可告警。
查看详情
Mistral 性能调优指南
mistral-performance-tuning
jeremylongshore/claude-code-plugins-plus-skills
134
指导团队通过选择合适模型、启用流式、缓存确定性请求、精简提示语和控制并发来降低 Mistral AI 的响应延迟并提升吞吐量。
查看详情
LLM模型剪枝优化
model-pruning
Orchestra-Research/AI-Research-SKILLs
104
使用Wanda、SparseGPT和结构/非结构/N:M稀疏剪枝,在不重训情况下将LLM压缩约50%,适配加速卡或边缘设备,减少内存与延迟。
查看详情
OpenEvidence 可观测性配置
openevidence-observability
jeremylongshore/claude-code-plugins-plus-skills
225
为 OpenEvidence 临床 AI 集成部署 Prometheus 指标、OpenTelemetry 链路、结构化日志及 Grafana 面板,持续观测服务健康、延迟、错误、缓存与告警。
查看详情
Pinecone 生产级向量数据库
pinecone
Orchestra-Research/AI-Research-SKILLs
181
Pinecone 提供全托管自动扩容的向量数据库,具备密集+稀疏混合搜索、元数据筛选与命名空间隔离,适合低延迟的生产级 RAG、推荐和语义搜索场景。
查看详情
Qdrant 向量相似度搜索
qdrant-vector-search
Orchestra-Research/AI-Research-SKILLs
405
基于 Rust 的高性能向量相似度引擎,适用于生产级 RAG 与语义搜索场景,支持混合过滤、多向量存储、分布式扩容以及 REST/gRPC 接入,低延迟提供推荐和检索服务。
查看详情
1
2
下一页
语言
简体中文
English