下载

Skill UI

浏览并发现 9952+ 精选技能

全部编程开发人工智能设计创意产品商业数据科学市场营销职场通用效率工具硬件工程语言学习

搜索低延迟，共找到 18 条记录

默认排序最新上传最多下载

Azure AI实时语音对话SDK

azure-ai-voicelive-java

sickn33/antigravity-awesome-skills

这是一个用于Java开发的SDK，用于实现与Azure AI助手的实时、双向语音对话。它通过WebSocket技术支持低延迟流媒体通信，并集成了高级功能，如语音活动检测、降噪处理和多种AI音色选择。非常适用于构建专业的语音机器人和交互式语音应用。

Azure语音转文本API

azure-speech-to-text-rest-py

sickn33/antigravity-awesome-skills

这是一个使用Python和REST API实现的Azure语音转文本功能。它允许用户通过HTTP请求，对时长不超过60秒的音频文件进行语音识别转录。该工具无需依赖官方SDK，适用于需要快速集成语音识别功能的开发场景，并支持分块传输以降低延迟。

上下文优化策略

context-optimization

sickn33/antigravity-awesome-skills

本技能提供了一套高级的LLM上下文管理框架，旨在提升有限上下文窗口的有效容量。它涵盖了压缩、观测屏蔽、KV缓存优化和上下文分区等四种核心技术。通过优化Token使用，可以有效解决上下文限制问题，帮助构建成本更低、延迟更小、能处理大规模文档和复杂任务的生产级AI Agent系统。

Deepgram实时流式语音转录

deepgram-core-workflow-b

jeremylongshore/claude-code-plugins-plus-skills

本指南展示了如何使用Deepgram的WebSocket API实现稳定、低延迟的实时流式语音转录。内容涵盖了麦克风输入采集、说话人指纹识别（diarization）、语句结束检测以及自动重连机制。适用于构建专业的语音助手、直播字幕系统或实时语音AI应用。

FAISS：高效向量相似性搜索库

Orchestra-Research/AI-Research-SKILLs

FAISS（Facebook AI Similarity Search）是一个用于高效相似性搜索和聚类的库。它支持对数十亿级别的密集向量进行索引和搜索，具备GPU加速和多种索引类型（如Flat、IVF、HNSW）。适用于构建需要超高吞吐量和低延迟的超大规模应用，特别是在RAG、推荐系统等领域，用于快速的k-NN检索或纯向量相似度匹配。

Groq API 聊天补全指南

groq-hello-world

jeremylongshore/claude-code-plugins-plus-skills

本指南全面介绍了如何使用Groq的高速LPU进行聊天补全。内容包含TypeScript和Python代码示例，涵盖了基础聊天交互、流式响应处理，以及多模态和不同性能级别的模型使用。适用于希望快速构建高性能、低延迟AI应用的开发者。

Mistral AI API性能调优指南

mistral-performance-tuning

jeremylongshore/claude-code-plugins-plus-skills

本指南提供一套全面的Mistral AI API性能优化框架。内容涵盖模型选型、响应流式传输（Streaming）、请求缓存、并发控制到提示词优化等高级技术。帮助开发者解决API响应慢、吞吐量不足等问题，实现高效、低延迟、高稳定性的AI应用集成，是构建生产级AI系统的必备知识。

Pinecone托管向量数据库

Orchestra-Research/AI-Research-SKILLs

Pinecone是面向生产AI应用的托管向量数据库，提供自动扩容、混合搜索、命名空间和元数据过滤，适用于RAG、推荐或语义检索等低延迟场景，免维护的Serverless体验。

LLM 提示缓存方案

sickn33/antigravity-awesome-skills

介绍 Claude、OpenAI 等 LLM 的提示与响应缓存，以及 CAG 模式，用稳定上下文复用减少重复调用，降低延迟与费用。

实时语音对话智能体开发

sickn33/antigravity-awesome-skills

本技能旨在构建先进的语音AI智能体，实现自然流畅、低延迟的实时人机对话。它深入探讨了两种核心架构：低延迟的语音到语音（S2S）模式和可控的STT→LLM→TTS流水线。核心挑战在于优化端到端延迟（目标小于800ms），处理对话中断、噪音和情感细微差别，适用于客服、IVR和实时翻译等专业场景。

实时多模态AI智能体构建

sickn33/antigravity-awesome-skills

这是一个用于构建生产级、低延迟的实时多模态AI智能体框架。它允许开发者在一个统一的管道中编排复杂的AI流程，无缝处理实时音频、视频和文本数据。核心功能包括集成多种AI服务（如LLM、语音识别、TTS），管理对话上下文，并支持函数调用，适用于构建高级交互式AI应用。

ElevenLabs TTS与声音克隆工作流

elevenlabs-core-workflow-a

jeremylongshore/claude-code-plugins-plus-skills

本流程实现了基于ElevenLabs的文本转语音（TTS）和声音克隆功能。用户可以利用该流程生成高质量、可控的语音内容，包括高级音色和风格调节。它支持从音频样本进行即时声音克隆，并提供WebSocket流式传输，适用于构建实时聊天机器人、直播或需要低延迟音频的应用场景。

语言