登录
下载
Skill UI
浏览并发现
9952+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
低延迟
,共找到
18
条记录
默认排序
最新上传
最多下载
Azure AI实时语音对话SDK
azure-ai-voicelive-java
sickn33/antigravity-awesome-skills
63
这是一个用于Java开发的SDK,用于实现与Azure AI助手的实时、双向语音对话。它通过WebSocket技术支持低延迟流媒体通信,并集成了高级功能,如语音活动检测、降噪处理和多种AI音色选择。非常适用于构建专业的语音机器人和交互式语音应用。
查看详情
Azure语音转文本API
azure-speech-to-text-rest-py
sickn33/antigravity-awesome-skills
60
这是一个使用Python和REST API实现的Azure语音转文本功能。它允许用户通过HTTP请求,对时长不超过60秒的音频文件进行语音识别转录。该工具无需依赖官方SDK,适用于需要快速集成语音识别功能的开发场景,并支持分块传输以降低延迟。
查看详情
上下文优化策略
context-optimization
sickn33/antigravity-awesome-skills
293
本技能提供了一套高级的LLM上下文管理框架,旨在提升有限上下文窗口的有效容量。它涵盖了压缩、观测屏蔽、KV缓存优化和上下文分区等四种核心技术。通过优化Token使用,可以有效解决上下文限制问题,帮助构建成本更低、延迟更小、能处理大规模文档和复杂任务的生产级AI Agent系统。
查看详情
Deepgram实时流式语音转录
deepgram-core-workflow-b
jeremylongshore/claude-code-plugins-plus-skills
451
本指南展示了如何使用Deepgram的WebSocket API实现稳定、低延迟的实时流式语音转录。内容涵盖了麦克风输入采集、说话人指纹识别(diarization)、语句结束检测以及自动重连机制。适用于构建专业的语音助手、直播字幕系统或实时语音AI应用。
查看详情
FAISS:高效向量相似性搜索库
faiss
Orchestra-Research/AI-Research-SKILLs
276
FAISS(Facebook AI Similarity Search)是一个用于高效相似性搜索和聚类的库。它支持对数十亿级别的密集向量进行索引和搜索,具备GPU加速和多种索引类型(如Flat、IVF、HNSW)。适用于构建需要超高吞吐量和低延迟的超大规模应用,特别是在RAG、推荐系统等领域,用于快速的k-NN检索或纯向量相似度匹配。
查看详情
Groq API 聊天补全指南
groq-hello-world
jeremylongshore/claude-code-plugins-plus-skills
466
本指南全面介绍了如何使用Groq的高速LPU进行聊天补全。内容包含TypeScript和Python代码示例,涵盖了基础聊天交互、流式响应处理,以及多模态和不同性能级别的模型使用。适用于希望快速构建高性能、低延迟AI应用的开发者。
查看详情
Mistral AI API性能调优指南
mistral-performance-tuning
jeremylongshore/claude-code-plugins-plus-skills
65
本指南提供一套全面的Mistral AI API性能优化框架。内容涵盖模型选型、响应流式传输(Streaming)、请求缓存、并发控制到提示词优化等高级技术。帮助开发者解决API响应慢、吞吐量不足等问题,实现高效、低延迟、高稳定性的AI应用集成,是构建生产级AI系统的必备知识。
查看详情
Pinecone托管向量数据库
pinecone
Orchestra-Research/AI-Research-SKILLs
471
Pinecone是面向生产AI应用的托管向量数据库,提供自动扩容、混合搜索、命名空间和元数据过滤,适用于RAG、推荐或语义检索等低延迟场景,免维护的Serverless体验。
查看详情
LLM 提示缓存方案
prompt-caching
sickn33/antigravity-awesome-skills
295
介绍 Claude、OpenAI 等 LLM 的提示与响应缓存,以及 CAG 模式,用稳定上下文复用减少重复调用,降低延迟与费用。
查看详情
实时语音对话智能体开发
voice-agents
sickn33/antigravity-awesome-skills
141
本技能旨在构建先进的语音AI智能体,实现自然流畅、低延迟的实时人机对话。它深入探讨了两种核心架构:低延迟的语音到语音(S2S)模式和可控的STT→LLM→TTS流水线。核心挑战在于优化端到端延迟(目标小于800ms),处理对话中断、噪音和情感细微差别,适用于客服、IVR和实时翻译等专业场景。
查看详情
实时多模态AI智能体构建
daily
sickn33/antigravity-awesome-skills
472
这是一个用于构建生产级、低延迟的实时多模态AI智能体框架。它允许开发者在一个统一的管道中编排复杂的AI流程,无缝处理实时音频、视频和文本数据。核心功能包括集成多种AI服务(如LLM、语音识别、TTS),管理对话上下文,并支持函数调用,适用于构建高级交互式AI应用。
查看详情
ElevenLabs TTS与声音克隆工作流
elevenlabs-core-workflow-a
jeremylongshore/claude-code-plugins-plus-skills
190
本流程实现了基于ElevenLabs的文本转语音(TTS)和声音克隆功能。用户可以利用该流程生成高质量、可控的语音内容,包括高级音色和风格调节。它支持从音频样本进行即时声音克隆,并提供WebSocket流式传输,适用于构建实时聊天机器人、直播或需要低延迟音频的应用场景。
查看详情
1
2
下一页
语言
简体中文
English