下载

Skill UI

浏览并发现 9688+ 精选技能

全部编程开发人工智能设计创意产品商业数据科学市场营销职场通用效率工具硬件工程语言学习

搜索语音转文本，共找到 37 条记录

默认排序最新上传最多下载

Pipecat低延迟语音助手构建教程

pipecat-friday-agent

sickn33/antigravity-awesome-skills

本技能提供了一个完整的F.R.I.D.A.Y.（铁人战甲风格）语音助手的构建蓝图。它利用Pipecat框架，构建了一个低延迟的语音管道，流程包括语音识别(STT)、大型语言模型(LLM)和文本转语音(TTS)，支持集成Gemini和OpenAI等多个AI服务商，适用于构建实时、多模态的对话系统。

ElevenLabs TTS与声音克隆工作流

elevenlabs-core-workflow-a

jeremylongshore/claude-code-plugins-plus-skills

本流程实现了基于ElevenLabs的文本转语音（TTS）和声音克隆功能。用户可以利用该流程生成高质量、可控的语音内容，包括高级音色和风格调节。它支持从音频样本进行即时声音克隆，并提供WebSocket流式传输，适用于构建实时聊天机器人、直播或需要低延迟音频的应用场景。

AssemblyAI转录成本优化指南

assemblyai-cost-tuning

jeremylongshore/claude-code-plugins-plus-skills

本技能旨在提供一套完整的AssemblyAI成本优化指南。它详细说明了如何在语音转文本过程中，通过模型选择、功能模块预算（如说话人分离、情感分析）和成本估算，最大限度地降低转录费用。适用于需要精细化成本控制和高效率资源管理的商业项目。

AssemblyAI生产级架构设计

assemblyai-reference-architecture

jeremylongshore/claude-code-plugins-plus-skills

本文件提供了基于AssemblyAI的生产级转录服务参考架构。它遵循分层设计原则，覆盖了从API接口、服务逻辑到Webhook处理、批量任务和LeMUR高级分析的完整流程。适用于需要构建高可靠性、可扩展语音转文本系统的开发场景。

AssemblyAI CI/CD集成测试指南

assemblyai-ci-integration

jeremylongshore/claude-code-plugins-plus-skills

本指南提供了一套完整的AssemblyAI CI/CD集成方案，用于自动化测试语音转文本项目。它详细介绍了如何使用GitHub Actions配置工作流，包含无成本的本地单元测试（Mocked）和受控的实测集成测试。确保您的转录服务在自动化构建流程中保持稳定和可靠。

AssemblyAI SDK 生产级模式

assemblyai-sdk-patterns

jeremylongshore/claude-code-plugins-plus-skills

本指南提供了在TypeScript和Python中集成AssemblyAI SDK的生产级架构模式。内容涵盖单例客户端实现、服务封装、高级错误处理（如指数退避重试）以及多租户管理。适用于构建高可靠、可扩展的语音转文本系统。

高级音频处理与语音合成

elevenlabs-core-workflow-b

jeremylongshore/claude-code-plugins-plus-skills

本工作流提供了一套全面的专业音频处理解决方案。它集成了语音到语音转换（变声器）、文本生成音效、音频降噪隔离和语音转文字转录等多个高级功能。适用于内容创作、播客制作、音频编辑等需要高质量声音处理的场景。

ElevenLabs语音合成API指南

elevenlabs-hello-world

jeremylongshore/claude-code-plugins-plus-skills

本技能提供了一份完整的ElevenLabs语音合成API使用指南。内容涵盖使用TypeScript、Python和cURL等多种方式，实现文本到语音的高质量转换。用户可以学习如何精细控制语音参数、选择不同模型（如低延迟流式传输），适用于各类需要高质量语音内容生成的应用开发。

ElevenLabs API认证与配置

elevenlabs-install-auth

jeremylongshore/claude-code-plugins-plus-skills

本指南详细介绍了如何在Node.js和Python环境中安装并配置ElevenLabs SDK。内容涵盖了如何使用环境变量设置API密钥、初始化客户端连接，并通过列出可用音色等方式进行连接验证。适用于所有需要集成高级文本转语音（TTS）或语音合成功能的开发场景。

本地离线文本转语音与声音克隆

jeremylongshore/claude-code-plugins-plus-skills

本技能基于VoxCPM2模型实现本地离线文本转语音合成。支持30种语言，提供三种先进模式：标准语音合成、描述式声音设计，以及从用户提供的参考音频进行声音克隆。所有处理均在本地设备上完成，无需任何API调用或网络连接，非常适合制作高质量的视频旁白、播客音频或语音消息。

语音转文本开发集成指南

wispr-ci-integration

jeremylongshore/claude-code-plugins-plus-skills

提供完整的Wispr Flow语音转文本API集成指南。本技能指导开发者如何将语音输入功能集成到开发工作流中，支持低延迟的WebSocket流式传输和REST API调用。适用于构建语音控制应用、实时代码或命令行指令的转录功能，确保在编程和开发场景下的准确性和稳定性。

Wispr Flow语音转文本错误指南

wispr-common-errors

jeremylongshore/claude-code-plugins-plus-skills

本指南为开发者提供了Wispr Flow语音转文本API的全面错误处理和故障排除文档。它涵盖了WebSocket流式传输、REST API调用以及通用听写工作流中的常见问题。用户可以学习如何解决认证失败、网络断开和准确度低等错误，从而顺利集成语音能力。

上一页 123 4 下一页

语言