登录
下载
Skill UI
浏览并发现
9785+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
低延迟
,共找到
65
条记录
默认排序
最新上传
最多下载
Azure AI实时语音对话SDK
azure-ai-voicelive-java
sickn33/antigravity-awesome-skills
63
这是一个用于Java开发的SDK,用于实现与Azure AI助手的实时、双向语音对话。它通过WebSocket技术支持低延迟流媒体通信,并集成了高级功能,如语音活动检测、降噪处理和多种AI音色选择。非常适用于构建专业的语音机器人和交互式语音应用。
查看详情
Azure语音转文本API
azure-speech-to-text-rest-py
sickn33/antigravity-awesome-skills
60
这是一个使用Python和REST API实现的Azure语音转文本功能。它允许用户通过HTTP请求,对时长不超过60秒的音频文件进行语音识别转录。该工具无需依赖官方SDK,适用于需要快速集成语音识别功能的开发场景,并支持分块传输以降低延迟。
查看详情
构建可扩展的WebSocket服务器
building-websocket-server
jeremylongshore/claude-code-plugins-plus-skills
111
这是一个用于构建高并发、可扩展WebSocket服务器的专业指南。它覆盖了实时、双向通信的完整流程,包括连接生命周期管理、房间/频道订阅逻辑、心跳机制以及通过Redis实现集群级别的消息广播。适用于开发实时聊天室、数据仪表盘和协同编辑等需要低延迟和高可靠性通信的应用。
查看详情
上下文优化策略
context-optimization
sickn33/antigravity-awesome-skills
293
本技能提供了一套高级的LLM上下文管理框架,旨在提升有限上下文窗口的有效容量。它涵盖了压缩、观测屏蔽、KV缓存优化和上下文分区等四种核心技术。通过优化Token使用,可以有效解决上下文限制问题,帮助构建成本更低、延迟更小、能处理大规模文档和复杂任务的生产级AI Agent系统。
查看详情
智能报警规则创建
creating-alerting-rules
jeremylongshore/claude-code-plugins-plus-skills
66
该技能辅助 SRE/DevOps 团队自动设定延迟、错误率、吞吐量等性能警报,涵盖阈值、路由、升级策略及运行手册,降低误报并提升监控响应效率。
查看详情
Customer.io高并发性能调优
customerio-performance-tuning
jeremylongshore/claude-code-plugins-plus-skills
500
本技能提供一套高级工程方法,用于解决高并发、大流量的Customer.io API集成性能瓶颈。它通过实现HTTP连接池、本地去重缓存、并行批量处理和异步追踪等机制,能够将原本耗时的操作(如批量事件)延迟从秒级降低到毫秒级,确保系统在高负载下的稳定性和高性能。
查看详情
Deepgram实时流式语音转录
deepgram-core-workflow-b
jeremylongshore/claude-code-plugins-plus-skills
451
本指南展示了如何使用Deepgram的WebSocket API实现稳定、低延迟的实时流式语音转录。内容涵盖了麦克风输入采集、说话人指纹识别(diarization)、语句结束检测以及自动重连机制。适用于构建专业的语音助手、直播字幕系统或实时语音AI应用。
查看详情
Exa API负载测试与扩容
exa-load-scale
jeremylongshore/claude-code-plugins-plus-skills
142
本指南提供了一套完整的Exa API负载测试、容量规划和扩容策略。它指导用户如何进行压力测试,管理API的速率限制(QPS),并优化搜索架构。核心内容包括使用k6进行性能基准测试、实现LRU缓存,以及通过请求队列提升系统的整体吞吐量,适用于构建高并发、低延迟的RAG系统。
查看详情
Exa API 性能优化指南
exa-performance-tuning
jeremylongshore/claude-code-plugins-plus-skills
416
本指南提供了优化Exa API性能的进阶技术模式。它涵盖了多个关键优化策略,包括:根据延迟预算选择最佳搜索类型、使用LRU实现结果缓存、限制内容提取范围以节省资源,以及利用并行查询最大化吞吐量。适用于需要构建高可靠、低延迟、高吞吐量的生产级搜索系统。
查看详情
FAISS:高效向量相似性搜索库
faiss
Orchestra-Research/AI-Research-SKILLs
276
FAISS(Facebook AI Similarity Search)是一个用于高效相似性搜索和聚类的库。它支持对数十亿级别的密集向量进行索引和搜索,具备GPU加速和多种索引类型(如Flat、IVF、HNSW)。适用于构建需要超高吞吐量和低延迟的超大规模应用,特别是在RAG、推荐系统等领域,用于快速的k-NN检索或纯向量相似度匹配。
查看详情
Gamma API性能优化指南
gamma-performance-tuning
jeremylongshore/claude-code-plugins-plus-skills
322
本指南提供了优化Gamma API交互的高级策略。内容涵盖了智能轮询(Smart Polling)、静态数据缓存、并行批处理、以及通过调整内容参数来降低生成延迟等最佳实践。适用于构建高性能、高可靠性的Gamma集成系统。
查看详情
Groq跨云平台部署指南
groq-deploy-integration
jeremylongshore/claude-code-plugins-plus-skills
118
本指南详细介绍了如何将基于Groq推理API的应用部署到各种主流生产环境,包括Vercel Edge、Cloud Run、Docker等。它提供了完整的部署流程和代码示例,帮助开发者配置平台特定的环境和密钥,确保AI服务具备低延迟和高可用性。
查看详情
1
2
3
4
5
6
下一页
语言
简体中文
English