登录
下载
Skill UI
浏览并发现
9119+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
语音合成
,共找到
13
条记录
默认排序
最新上传
最多下载
Azure 实时语音AI开发SDK
azure-ai-voicelive-py
sickn33/antigravity-awesome-skills
105
该SDK用于构建实时、双向的语音AI应用,通过WebSocket支持实时的语音流媒体通信。它允许开发者将麦克风音频输入模型,并接收合成语音输出。适用于开发智能语音助手、交互式语音系统和呼叫中心解决方案。
查看详情
Deepgram SDK 生产最佳实践
deepgram-sdk-patterns
jeremylongshore/claude-code-plugins-plus-skills
421
为使用 TypeScript 和 Python 集成 Deepgram 提供了生产级别的代码模式和最佳实践。本指南涵盖了单例客户端管理、Aura 文本转语音合成,以及复杂的音频智能流程(如摘要、话题和情感分析)。适用于任何需要构建健壮、标准化的 Deepgram 集成系统,或进行代码重构和版本升级的开发者。
查看详情
Deepgram SDK升级与迁移指南
deepgram-upgrade-migration
jeremylongshore/claude-code-plugins-plus-skills
365
本指南为开发者提供了Deepgram SDK从旧版本(v3/v4)迁移到新版本(v5)的完整路线图。它详细介绍了版本升级的破坏性变更,包括API对比和最佳实践代码,并指导用户完成模型从Nova-2到Nova-3的升级,确保语音识别和文本合成流程的平稳过渡。
查看详情
文本语音音频处理
fal-audio
sickn33/antigravity-awesome-skills
83
本技能利用fal.ai模型提供双向音频处理能力。它支持文本转语音(TTS),将文字转换为自然语音;以及语音转文本(STT),将语音准确转录为文字。适用于需要处理音频输入分析或合成语音输出的场景,如语音助手、内容数字化或多语言应用。
查看详情
Groq多模态工作流:语音、图像、语音合成
groq-core-workflow-b
jeremylongshore/claude-code-plugins-plus-skills
122
该工作流是基于Groq的综合多模态解决方案,超越了基础的聊天补全功能。它支持超快速的音频转录(Whisper),利用视觉模型进行图像理解,以及高质量的文本转语音合成。适用于实时内容处理、多媒体分析和自动化内容生成等场景。
查看详情
高级音频处理与语音合成
elevenlabs-core-workflow-b
jeremylongshore/claude-code-plugins-plus-skills
232
本工作流提供了一套全面的专业音频处理解决方案。它集成了语音到语音转换(变声器)、文本生成音效、音频降噪隔离和语音转文字转录等多个高级功能。适用于内容创作、播客制作、音频编辑等需要高质量声音处理的场景。
查看详情
ElevenLabs成本优化与配额监控
elevenlabs-cost-tuning
jeremylongshore/claude-code-plugins-plus-skills
446
本技能旨在帮助用户优化 ElevenLabs 语音合成(TTS)的运行成本。它提供了一套完整的流程,包括基于成本的模型选择、通过优化文本内容来减少计费字符数,以及实现实时的配额使用监控和预算预警。适用于构建高并发、对成本敏感的语音应用。
查看详情
ElevenLabs TTS云端部署指南
elevenlabs-deploy-integration
jeremylongshore/claude-code-plugins-plus-skills
102
本技能提供将 ElevenLabs TTS 应用部署到主流云平台(如 Vercel, Fly.io, Cloud Run)的完整指南。内容涵盖了服务器无服务器部署、容器化部署、密钥安全管理、以及实现实时流媒体音频流的最佳实践,适用于构建生产级的语音合成应用。
查看详情
ElevenLabs语音合成API指南
elevenlabs-hello-world
jeremylongshore/claude-code-plugins-plus-skills
224
本技能提供了一份完整的ElevenLabs语音合成API使用指南。内容涵盖使用TypeScript、Python和cURL等多种方式,实现文本到语音的高质量转换。用户可以学习如何精细控制语音参数、选择不同模型(如低延迟流式传输),适用于各类需要高质量语音内容生成的应用开发。
查看详情
ElevenLabs API认证与配置
elevenlabs-install-auth
jeremylongshore/claude-code-plugins-plus-skills
255
本指南详细介绍了如何在Node.js和Python环境中安装并配置ElevenLabs SDK。内容涵盖了如何使用环境变量设置API密钥、初始化客户端连接,并通过列出可用音色等方式进行连接验证。适用于所有需要集成高级文本转语音(TTS)或语音合成功能的开发场景。
查看详情
ElevenLabs SDK升级与模型迁移
elevenlabs-upgrade-migration
jeremylongshore/claude-code-plugins-plus-skills
245
本指南详细介绍了ElevenLabs SDK(JS和Python)的升级和模型迁移流程。它涵盖了SDK包名变更、模型世代升级(如v1到v3)以及API端点注意事项。帮助开发者顺利适应平台更新,确保语音合成功能持续稳定运行。
查看详情
本地离线文本转语音与声音克隆
local-tts
jeremylongshore/claude-code-plugins-plus-skills
405
本技能基于VoxCPM2模型实现本地离线文本转语音合成。支持30种语言,提供三种先进模式:标准语音合成、描述式声音设计,以及从用户提供的参考音频进行声音克隆。所有处理均在本地设备上完成,无需任何API调用或网络连接,非常适合制作高质量的视频旁白、播客音频或语音消息。
查看详情
1
2
下一页
语言
简体中文
English