登录
下载
Skill UI
浏览并发现
9673+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
TTS
,共找到
32
条记录
默认排序
最新上传
最多下载
Azure呼叫自动化(Java)
azure-communication-callautomation-java
sickn33/antigravity-awesome-skills
265
该Java SDK用于构建复杂的服务器端呼叫自动化工作流,基于Azure通信服务。它支持实现IVR系统、动态呼叫路由、媒体播放(TTS/音频)、语音识别、DTMF录音、呼叫录制和参与者管理。适用于构建智能客服机器人或自动化通知系统。
查看详情
Azure呼叫自动化(Java)
azure-communication-callautomation-java
sickn33/antigravity-awesome-skills
265
该Java SDK用于构建复杂的服务器端呼叫自动化工作流,基于Azure通信服务。它支持实现IVR系统、动态呼叫路由、媒体播放(TTS/音频)、语音识别、DTMF录音、呼叫录制和参与者管理。适用于构建智能客服机器人或自动化通知系统。
查看详情
Deepgram CI/CD自动化集成
deepgram-ci-integration
jeremylongshore/claude-code-plugins-plus-skills
423
本技能提供使用GitHub Actions为Deepgram集成配置完整的CI/CD流水线。它涵盖了单元测试、真实的API集成测试(包括转录、说话人分离)和烟雾测试。适用于需要确保Deepgram相关应用在代码提交或部署时具备自动化、稳定测试流程的开发场景。
查看详情
Deepgram SDK安装与认证
deepgram-install-auth
jeremylongshore/claude-code-plugins-plus-skills
89
本技能提供了针对Node.js和Python环境的Deepgram SDK的完整安装和配置指南。内容涵盖了安全的环境变量API密钥管理、客户端初始化以及连接验证。适用于需要将Deepgram强大的语音转文本(STT)和文本转语音(TTS)功能集成到新项目中的开发者。
查看详情
ElevenLabs 语音自动化
elevenlabs-automation
ComposioHQ/awesome-claude-skills
231
通过 Composio MCP 一键驱动 ElevenLabs 文本转语音工作流:生成语音、查看音色/模型、核对订阅额度、流式播放并重取历史音频。
查看详情
文本语音音频处理
fal-audio
sickn33/antigravity-awesome-skills
83
本技能利用fal.ai模型提供双向音频处理能力。它支持文本转语音(TTS),将文字转换为自然语音;以及语音转文本(STT),将语音准确转录为文字。适用于需要处理音频输入分析或合成语音输出的场景,如语音助手、内容数字化或多语言应用。
查看详情
Groq多模态工作流:语音、图像、语音合成
groq-core-workflow-b
jeremylongshore/claude-code-plugins-plus-skills
122
该工作流是基于Groq的综合多模态解决方案,超越了基础的聊天补全功能。它支持超快速的音频转录(Whisper),利用视觉模型进行图像理解,以及高质量的文本转语音合成。适用于实时内容处理、多媒体分析和自动化内容生成等场景。
查看详情
GroqCloud 自动化套件
groqcloud-automation
ComposioHQ/awesome-claude-skills
302
GroqCloud 自动化通过 Composio 调度高性能 API,涵盖推理、聊天输出、音频翻译与 TTS 语音选择,适合构建生产级 AI 流程。
查看详情
语言学习本地开发与测试环境配置
speak-local-dev-loop
jeremylongshore/claude-code-plugins-plus-skills
125
本指南旨在提供一套完整的语言学习应用本地开发工作流。它解决了离线开发和测试的痛点,通过配置模拟导师(Mock Tutor)响应、生成音频测试素材(Fixtures)和实现详细的发音评分调试模式,确保开发人员能够高效、准确地进行单元和集成测试,无需依赖实时API。
查看详情
实时语音对话智能体开发
voice-agents
sickn33/antigravity-awesome-skills
141
本技能旨在构建先进的语音AI智能体,实现自然流畅、低延迟的实时人机对话。它深入探讨了两种核心架构:低延迟的语音到语音(S2S)模式和可控的STT→LLM→TTS流水线。核心挑战在于优化端到端延迟(目标小于800ms),处理对话中断、噪音和情感细微差别,适用于客服、IVR和实时翻译等专业场景。
查看详情
语音 AI 引擎开发
voice-ai-engine-development
sickn33/antigravity-awesome-skills
248
指导如何基于异步队列流水线构建具备实时转录、LLM 应答与可中断 TTS 的多厂商语音 AI 引擎。
查看详情
OpenClaw 语音呼叫助手
clawring
davepoon/buildwithclaude
375
让 OpenClaw 机器人通过托管语音服务主动拨打电话,用于提醒、汇报、报警等场景,无需 Twilio 或 Webhook,通话中实时转写语音并通过 TTS 回复,操作体验与聊天一致。
查看详情
1
2
3
下一页
语言
简体中文
English