下载

Skill UI

浏览并发现 9119+ 精选技能

全部编程开发人工智能设计创意产品商业数据科学市场营销职场通用效率工具硬件工程语言学习

搜索语音合成，共找到 13 条记录

默认排序最新上传最多下载

Azure 实时语音AI开发SDK

azure-ai-voicelive-py

sickn33/antigravity-awesome-skills

该SDK用于构建实时、双向的语音AI应用，通过WebSocket支持实时的语音流媒体通信。它允许开发者将麦克风音频输入模型，并接收合成语音输出。适用于开发智能语音助手、交互式语音系统和呼叫中心解决方案。

Deepgram SDK 生产最佳实践

deepgram-sdk-patterns

jeremylongshore/claude-code-plugins-plus-skills

为使用 TypeScript 和 Python 集成 Deepgram 提供了生产级别的代码模式和最佳实践。本指南涵盖了单例客户端管理、Aura 文本转语音合成，以及复杂的音频智能流程（如摘要、话题和情感分析）。适用于任何需要构建健壮、标准化的 Deepgram 集成系统，或进行代码重构和版本升级的开发者。

Deepgram SDK升级与迁移指南

deepgram-upgrade-migration

jeremylongshore/claude-code-plugins-plus-skills

本指南为开发者提供了Deepgram SDK从旧版本（v3/v4）迁移到新版本（v5）的完整路线图。它详细介绍了版本升级的破坏性变更，包括API对比和最佳实践代码，并指导用户完成模型从Nova-2到Nova-3的升级，确保语音识别和文本合成流程的平稳过渡。

文本语音音频处理

sickn33/antigravity-awesome-skills

本技能利用fal.ai模型提供双向音频处理能力。它支持文本转语音（TTS），将文字转换为自然语音；以及语音转文本（STT），将语音准确转录为文字。适用于需要处理音频输入分析或合成语音输出的场景，如语音助手、内容数字化或多语言应用。

Groq多模态工作流：语音、图像、语音合成

groq-core-workflow-b

jeremylongshore/claude-code-plugins-plus-skills

该工作流是基于Groq的综合多模态解决方案，超越了基础的聊天补全功能。它支持超快速的音频转录（Whisper），利用视觉模型进行图像理解，以及高质量的文本转语音合成。适用于实时内容处理、多媒体分析和自动化内容生成等场景。

高级音频处理与语音合成

elevenlabs-core-workflow-b

jeremylongshore/claude-code-plugins-plus-skills

本工作流提供了一套全面的专业音频处理解决方案。它集成了语音到语音转换（变声器）、文本生成音效、音频降噪隔离和语音转文字转录等多个高级功能。适用于内容创作、播客制作、音频编辑等需要高质量声音处理的场景。

ElevenLabs成本优化与配额监控

elevenlabs-cost-tuning

jeremylongshore/claude-code-plugins-plus-skills

本技能旨在帮助用户优化 ElevenLabs 语音合成（TTS）的运行成本。它提供了一套完整的流程，包括基于成本的模型选择、通过优化文本内容来减少计费字符数，以及实现实时的配额使用监控和预算预警。适用于构建高并发、对成本敏感的语音应用。

ElevenLabs TTS云端部署指南

elevenlabs-deploy-integration

jeremylongshore/claude-code-plugins-plus-skills

本技能提供将 ElevenLabs TTS 应用部署到主流云平台（如 Vercel, Fly.io, Cloud Run）的完整指南。内容涵盖了服务器无服务器部署、容器化部署、密钥安全管理、以及实现实时流媒体音频流的最佳实践，适用于构建生产级的语音合成应用。

ElevenLabs语音合成API指南

elevenlabs-hello-world

jeremylongshore/claude-code-plugins-plus-skills

本技能提供了一份完整的ElevenLabs语音合成API使用指南。内容涵盖使用TypeScript、Python和cURL等多种方式，实现文本到语音的高质量转换。用户可以学习如何精细控制语音参数、选择不同模型（如低延迟流式传输），适用于各类需要高质量语音内容生成的应用开发。

ElevenLabs API认证与配置

elevenlabs-install-auth

jeremylongshore/claude-code-plugins-plus-skills

本指南详细介绍了如何在Node.js和Python环境中安装并配置ElevenLabs SDK。内容涵盖了如何使用环境变量设置API密钥、初始化客户端连接，并通过列出可用音色等方式进行连接验证。适用于所有需要集成高级文本转语音（TTS）或语音合成功能的开发场景。

ElevenLabs SDK升级与模型迁移

elevenlabs-upgrade-migration

jeremylongshore/claude-code-plugins-plus-skills

本指南详细介绍了ElevenLabs SDK（JS和Python）的升级和模型迁移流程。它涵盖了SDK包名变更、模型世代升级（如v1到v3）以及API端点注意事项。帮助开发者顺利适应平台更新，确保语音合成功能持续稳定运行。

本地离线文本转语音与声音克隆

jeremylongshore/claude-code-plugins-plus-skills

本技能基于VoxCPM2模型实现本地离线文本转语音合成。支持30种语言，提供三种先进模式：标准语音合成、描述式声音设计，以及从用户提供的参考音频进行声音克隆。所有处理均在本地设备上完成，无需任何API调用或网络连接，非常适合制作高质量的视频旁白、播客音频或语音消息。

语言