登录
下载
Skill UI
浏览并发现
9688+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
语音转文本
,共找到
37
条记录
默认排序
最新上传
最多下载
Pipecat低延迟语音助手构建教程
pipecat-friday-agent
sickn33/antigravity-awesome-skills
344
本技能提供了一个完整的F.R.I.D.A.Y.(铁人战甲风格)语音助手的构建蓝图。它利用Pipecat框架,构建了一个低延迟的语音管道,流程包括语音识别(STT)、大型语言模型(LLM)和文本转语音(TTS),支持集成Gemini和OpenAI等多个AI服务商,适用于构建实时、多模态的对话系统。
查看详情
ElevenLabs TTS与声音克隆工作流
elevenlabs-core-workflow-a
jeremylongshore/claude-code-plugins-plus-skills
190
本流程实现了基于ElevenLabs的文本转语音(TTS)和声音克隆功能。用户可以利用该流程生成高质量、可控的语音内容,包括高级音色和风格调节。它支持从音频样本进行即时声音克隆,并提供WebSocket流式传输,适用于构建实时聊天机器人、直播或需要低延迟音频的应用场景。
查看详情
AssemblyAI转录成本优化指南
assemblyai-cost-tuning
jeremylongshore/claude-code-plugins-plus-skills
234
本技能旨在提供一套完整的AssemblyAI成本优化指南。它详细说明了如何在语音转文本过程中,通过模型选择、功能模块预算(如说话人分离、情感分析)和成本估算,最大限度地降低转录费用。适用于需要精细化成本控制和高效率资源管理的商业项目。
查看详情
AssemblyAI生产级架构设计
assemblyai-reference-architecture
jeremylongshore/claude-code-plugins-plus-skills
197
本文件提供了基于AssemblyAI的生产级转录服务参考架构。它遵循分层设计原则,覆盖了从API接口、服务逻辑到Webhook处理、批量任务和LeMUR高级分析的完整流程。适用于需要构建高可靠性、可扩展语音转文本系统的开发场景。
查看详情
AssemblyAI CI/CD集成测试指南
assemblyai-ci-integration
jeremylongshore/claude-code-plugins-plus-skills
283
本指南提供了一套完整的AssemblyAI CI/CD集成方案,用于自动化测试语音转文本项目。它详细介绍了如何使用GitHub Actions配置工作流,包含无成本的本地单元测试(Mocked)和受控的实测集成测试。确保您的转录服务在自动化构建流程中保持稳定和可靠。
查看详情
AssemblyAI SDK 生产级模式
assemblyai-sdk-patterns
jeremylongshore/claude-code-plugins-plus-skills
368
本指南提供了在TypeScript和Python中集成AssemblyAI SDK的生产级架构模式。内容涵盖单例客户端实现、服务封装、高级错误处理(如指数退避重试)以及多租户管理。适用于构建高可靠、可扩展的语音转文本系统。
查看详情
高级音频处理与语音合成
elevenlabs-core-workflow-b
jeremylongshore/claude-code-plugins-plus-skills
232
本工作流提供了一套全面的专业音频处理解决方案。它集成了语音到语音转换(变声器)、文本生成音效、音频降噪隔离和语音转文字转录等多个高级功能。适用于内容创作、播客制作、音频编辑等需要高质量声音处理的场景。
查看详情
ElevenLabs语音合成API指南
elevenlabs-hello-world
jeremylongshore/claude-code-plugins-plus-skills
224
本技能提供了一份完整的ElevenLabs语音合成API使用指南。内容涵盖使用TypeScript、Python和cURL等多种方式,实现文本到语音的高质量转换。用户可以学习如何精细控制语音参数、选择不同模型(如低延迟流式传输),适用于各类需要高质量语音内容生成的应用开发。
查看详情
ElevenLabs API认证与配置
elevenlabs-install-auth
jeremylongshore/claude-code-plugins-plus-skills
255
本指南详细介绍了如何在Node.js和Python环境中安装并配置ElevenLabs SDK。内容涵盖了如何使用环境变量设置API密钥、初始化客户端连接,并通过列出可用音色等方式进行连接验证。适用于所有需要集成高级文本转语音(TTS)或语音合成功能的开发场景。
查看详情
本地离线文本转语音与声音克隆
local-tts
jeremylongshore/claude-code-plugins-plus-skills
405
本技能基于VoxCPM2模型实现本地离线文本转语音合成。支持30种语言,提供三种先进模式:标准语音合成、描述式声音设计,以及从用户提供的参考音频进行声音克隆。所有处理均在本地设备上完成,无需任何API调用或网络连接,非常适合制作高质量的视频旁白、播客音频或语音消息。
查看详情
语音转文本开发集成指南
wispr-ci-integration
jeremylongshore/claude-code-plugins-plus-skills
491
提供完整的Wispr Flow语音转文本API集成指南。本技能指导开发者如何将语音输入功能集成到开发工作流中,支持低延迟的WebSocket流式传输和REST API调用。适用于构建语音控制应用、实时代码或命令行指令的转录功能,确保在编程和开发场景下的准确性和稳定性。
查看详情
Wispr Flow语音转文本错误指南
wispr-common-errors
jeremylongshore/claude-code-plugins-plus-skills
132
本指南为开发者提供了Wispr Flow语音转文本API的全面错误处理和故障排除文档。它涵盖了WebSocket流式传输、REST API调用以及通用听写工作流中的常见问题。用户可以学习如何解决认证失败、网络断开和准确度低等错误,从而顺利集成语音能力。
查看详情
上一页
1
2
3
4
下一页
语言
简体中文
English