登录
下载
Skill UI
浏览并发现
9765+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
语音助手
,共找到
12
条记录
默认排序
最新上传
最多下载
Azure AI 语音实时交互开发套件
azure-ai-voicelive-dotnet
sickn33/antigravity-awesome-skills
312
该SDK专为.NET开发者设计,用于构建实时的双向语音AI应用。它支持通过WebSocket进行通信,能够处理音频和文本流事件,并支持如函数调用等高级功能,是开发复杂虚拟助手和实时语音交互系统的理想工具。
查看详情
Azure AI实时语音对话SDK
azure-ai-voicelive-java
sickn33/antigravity-awesome-skills
63
这是一个用于Java开发的SDK,用于实现与Azure AI助手的实时、双向语音对话。它通过WebSocket技术支持低延迟流媒体通信,并集成了高级功能,如语音活动检测、降噪处理和多种AI音色选择。非常适用于构建专业的语音机器人和交互式语音应用。
查看详情
Azure 实时语音AI开发SDK
azure-ai-voicelive-py
sickn33/antigravity-awesome-skills
105
该SDK用于构建实时、双向的语音AI应用,通过WebSocket支持实时的语音流媒体通信。它允许开发者将麦克风音频输入模型,并接收合成语音输出。适用于开发智能语音助手、交互式语音系统和呼叫中心解决方案。
查看详情
Azure AI实时语音助理开发套件
azure-ai-voicelive-ts
sickn33/antigravity-awesome-skills
316
这是一个用于构建实时、双向语音AI应用的SDK。它通过WebSocket支持音视频流传输,能够处理用户语音输入、AI回复文本和音频流,并提供完整的会话管理功能。适用于在Node.js或浏览器环境中开发功能强大的语音助手和交互式AI代理。
查看详情
Deepgram实时流式语音转录
deepgram-core-workflow-b
jeremylongshore/claude-code-plugins-plus-skills
451
本指南展示了如何使用Deepgram的WebSocket API实现稳定、低延迟的实时流式语音转录。内容涵盖了麦克风输入采集、说话人指纹识别(diarization)、语句结束检测以及自动重连机制。适用于构建专业的语音助手、直播字幕系统或实时语音AI应用。
查看详情
文本语音音频处理
fal-audio
sickn33/antigravity-awesome-skills
83
本技能利用fal.ai模型提供双向音频处理能力。它支持文本转语音(TTS),将文字转换为自然语音;以及语音转文本(STT),将语音准确转录为文字。适用于需要处理音频输入分析或合成语音输出的场景,如语音助手、内容数字化或多语言应用。
查看详情
基于Alexa与Claude的智能语音助手
amazon-alexa
sickn33/antigravity-awesome-skills
162
本技能提供与Amazon Alexa的全面集成,旨在将普通Alexa设备升级为超智能语音助手。它利用Claude作为核心大脑,深度结合AWS全生态系统(如Lambda、DynamoDB、智能家居),用于构建高度专业化和智能化的语音交互应用。
查看详情
基于Claude的智能语音助手
auri-core
sickn33/antigravity-awesome-skills
80
Auri是一款基于亚马逊Alexa和Claude AI构建的下一代智能语音助手。它超越了简单的问答模式,能够进行多轮对话、保持上下文记忆,并具备深层推理能力。它能像人类一样,理解复杂的语境和情感,提供自然、贴心的巴西葡萄牙语回复,适用于需要高度情境感知和高级对话流程的场景。
查看详情
OpenClaw 语音呼叫助手
clawring
davepoon/buildwithclaude
375
让 OpenClaw 机器人通过托管语音服务主动拨打电话,用于提醒、汇报、报警等场景,无需 Twilio 或 Webhook,通话中实时转写语音并通过 TTS 回复,操作体验与聊天一致。
查看详情
Pipecat低延迟语音助手构建教程
pipecat-friday-agent
sickn33/antigravity-awesome-skills
344
本技能提供了一个完整的F.R.I.D.A.Y.(铁人战甲风格)语音助手的构建蓝图。它利用Pipecat框架,构建了一个低延迟的语音管道,流程包括语音识别(STT)、大型语言模型(LLM)和文本转语音(TTS),支持集成Gemini和OpenAI等多个AI服务商,适用于构建实时、多模态的对话系统。
查看详情
AI智能体电话通信平台
agentphone
sickn33/antigravity-awesome-skills
201
AgentPhone是一个为AI智能体设计的API通信平台。它通过API允许开发者为智能体提供电话和短信功能,支持呼入/呼出语音通话和实时消息交互。无论是使用内置的托管模式实现简单对话,还是通过Webhook实现复杂的自定义逻辑,都适用于构建专业的客服机器人或虚拟助手。
查看详情
实时语音转写与AI深度分析
assemblyai-core-workflow-b
jeremylongshore/claude-code-plugins-plus-skills
416
本工作流提供完整的音频处理能力,涵盖实时流式转写(适用于直播字幕和语音助手)和基于LeMUR的深度后处理。用户可以使用它来总结会议内容、根据转录稿件回答问题、提取待办事项,或对录制音频运行自定义LLM分析。
查看详情
1
语言
简体中文
English