登录
下载
Skill UI
浏览并发现
10192+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
TTS
,共找到
20
条记录
默认排序
最新上传
最多下载
Deepgram SDK安装与认证
deepgram-install-auth
jeremylongshore/claude-code-plugins-plus-skills
89
本技能提供了针对Node.js和Python环境的Deepgram SDK的完整安装和配置指南。内容涵盖了安全的环境变量API密钥管理、客户端初始化以及连接验证。适用于需要将Deepgram强大的语音转文本(STT)和文本转语音(TTS)功能集成到新项目中的开发者。
查看详情
文本语音音频处理
fal-audio
sickn33/antigravity-awesome-skills
83
本技能利用fal.ai模型提供双向音频处理能力。它支持文本转语音(TTS),将文字转换为自然语音;以及语音转文本(STT),将语音准确转录为文字。适用于需要处理音频输入分析或合成语音输出的场景,如语音助手、内容数字化或多语言应用。
查看详情
Groq多模态工作流:语音、图像、语音合成
groq-core-workflow-b
jeremylongshore/claude-code-plugins-plus-skills
122
该工作流是基于Groq的综合多模态解决方案,超越了基础的聊天补全功能。它支持超快速的音频转录(Whisper),利用视觉模型进行图像理解,以及高质量的文本转语音合成。适用于实时内容处理、多媒体分析和自动化内容生成等场景。
查看详情
GroqCloud 自动化套件
groqcloud-automation
ComposioHQ/awesome-claude-skills
302
GroqCloud 自动化通过 Composio 调度高性能 API,涵盖推理、聊天输出、音频翻译与 TTS 语音选择,适合构建生产级 AI 流程。
查看详情
实时语音对话智能体开发
voice-agents
sickn33/antigravity-awesome-skills
141
本技能旨在构建先进的语音AI智能体,实现自然流畅、低延迟的实时人机对话。它深入探讨了两种核心架构:低延迟的语音到语音(S2S)模式和可控的STT→LLM→TTS流水线。核心挑战在于优化端到端延迟(目标小于800ms),处理对话中断、噪音和情感细微差别,适用于客服、IVR和实时翻译等专业场景。
查看详情
语音 AI 引擎开发
voice-ai-engine-development
sickn33/antigravity-awesome-skills
248
指导如何基于异步队列流水线构建具备实时转录、LLM 应答与可中断 TTS 的多厂商语音 AI 引擎。
查看详情
OpenClaw 语音呼叫助手
clawring
davepoon/buildwithclaude
375
让 OpenClaw 机器人通过托管语音服务主动拨打电话,用于提醒、汇报、报警等场景,无需 Twilio 或 Webhook,通话中实时转写语音并通过 TTS 回复,操作体验与聊天一致。
查看详情
实时多模态AI智能体构建
daily
sickn33/antigravity-awesome-skills
472
这是一个用于构建生产级、低延迟的实时多模态AI智能体框架。它允许开发者在一个统一的管道中编排复杂的AI流程,无缝处理实时音频、视频和文本数据。核心功能包括集成多种AI服务(如LLM、语音识别、TTS),管理对话上下文,并支持函数调用,适用于构建高级交互式AI应用。
查看详情
ElevenLabs TTS与声音克隆工作流
elevenlabs-core-workflow-a
jeremylongshore/claude-code-plugins-plus-skills
190
本流程实现了基于ElevenLabs的文本转语音(TTS)和声音克隆功能。用户可以利用该流程生成高质量、可控的语音内容,包括高级音色和风格调节。它支持从音频样本进行即时声音克隆,并提供WebSocket流式传输,适用于构建实时聊天机器人、直播或需要低延迟音频的应用场景。
查看详情
ElevenLabs TTS性能优化指南
elevenlabs-performance-tuning
jeremylongshore/claude-code-plugins-plus-skills
469
本指南提供了优化ElevenLabs TTS性能的完整技术方案。内容涵盖了如何通过模型选择(如Flash模型)、利用流媒体(Streaming)接口以及优化音频格式,来显著降低语音生成延迟和提高数据吞吐量。适用于实时对话、IVR系统和高并发的语音内容生成场景。
查看详情
ElevenLabs速率限制与配额管理
elevenlabs-rate-limits
jeremylongshore/claude-code-plugins-plus-skills
371
本技能提供了一套完整的ElevenLabs API调用管理方案,用于处理复杂的速率限制、并发控制和配额监控。它实现了根据用户套餐级别的并发队列管理,并在系统过载时应用指数退避(Exponential Backoff),确保了TTS应用处理高并发请求的稳定性和可靠性。
查看详情
ElevenLabs成本优化与配额监控
elevenlabs-cost-tuning
jeremylongshore/claude-code-plugins-plus-skills
446
本技能旨在帮助用户优化 ElevenLabs 语音合成(TTS)的运行成本。它提供了一套完整的流程,包括基于成本的模型选择、通过优化文本内容来减少计费字符数,以及实现实时的配额使用监控和预算预警。适用于构建高并发、对成本敏感的语音应用。
查看详情
1
2
下一页
语言
简体中文
English