登录
下载
Skill UI
浏览并发现
9167+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
语音转文本
,共找到
22
条记录
默认排序
最新上传
最多下载
Deepgram API 错误排查指南
deepgram-common-errors
jeremylongshore/claude-code-plugins-plus-skills
245
本指南全面收录了Deepgram API的常见错误代码(HTTP/WebSocket),提供了从API密钥验证、音频格式优化到代码重试机制的排障流程。是开发人员进行语音转文本(STT)服务集成的必备参考资料。
查看详情
Deepgram语音转录快速上手
deepgram-hello-world
jeremylongshore/claude-code-plugins-plus-skills
84
本示例提供了一个关于Deepgram语音转文本的最小化工作示例。它展示了如何使用TypeScript和Python两种语言,从URL或本地文件对音频进行转录。用户可以学习基本API模式,包括使用高级功能如说话人识别(Diarization)和选择最佳模型(如nova-3),非常适合初次集成和测试Deepgram服务。
查看详情
Deepgram SDK 生产最佳实践
deepgram-sdk-patterns
jeremylongshore/claude-code-plugins-plus-skills
421
为使用 TypeScript 和 Python 集成 Deepgram 提供了生产级别的代码模式和最佳实践。本指南涵盖了单例客户端管理、Aura 文本转语音合成,以及复杂的音频智能流程(如摘要、话题和情感分析)。适用于任何需要构建健壮、标准化的 Deepgram 集成系统,或进行代码重构和版本升级的开发者。
查看详情
ElevenLabs 语音自动化
elevenlabs-automation
ComposioHQ/awesome-claude-skills
231
通过 Composio MCP 一键驱动 ElevenLabs 文本转语音工作流:生成语音、查看音色/模型、核对订阅额度、流式播放并重取历史音频。
查看详情
Pipecat低延迟语音助手构建教程
pipecat-friday-agent
sickn33/antigravity-awesome-skills
345
本技能提供了一个完整的F.R.I.D.A.Y.(铁人战甲风格)语音助手的构建蓝图。它利用Pipecat框架,构建了一个低延迟的语音管道,流程包括语音识别(STT)、大型语言模型(LLM)和文本转语音(TTS),支持集成Gemini和OpenAI等多个AI服务商,适用于构建实时、多模态的对话系统。
查看详情
AssemblyAI转录成本优化指南
assemblyai-cost-tuning
jeremylongshore/claude-code-plugins-plus-skills
234
本技能旨在提供一套完整的AssemblyAI成本优化指南。它详细说明了如何在语音转文本过程中,通过模型选择、功能模块预算(如说话人分离、情感分析)和成本估算,最大限度地降低转录费用。适用于需要精细化成本控制和高效率资源管理的商业项目。
查看详情
AssemblyAI生产级架构设计
assemblyai-reference-architecture
jeremylongshore/claude-code-plugins-plus-skills
197
本文件提供了基于AssemblyAI的生产级转录服务参考架构。它遵循分层设计原则,覆盖了从API接口、服务逻辑到Webhook处理、批量任务和LeMUR高级分析的完整流程。适用于需要构建高可靠性、可扩展语音转文本系统的开发场景。
查看详情
AssemblyAI CI/CD集成测试指南
assemblyai-ci-integration
jeremylongshore/claude-code-plugins-plus-skills
283
本指南提供了一套完整的AssemblyAI CI/CD集成方案,用于自动化测试语音转文本项目。它详细介绍了如何使用GitHub Actions配置工作流,包含无成本的本地单元测试(Mocked)和受控的实测集成测试。确保您的转录服务在自动化构建流程中保持稳定和可靠。
查看详情
AssemblyAI SDK 生产级模式
assemblyai-sdk-patterns
jeremylongshore/claude-code-plugins-plus-skills
368
本指南提供了在TypeScript和Python中集成AssemblyAI SDK的生产级架构模式。内容涵盖单例客户端实现、服务封装、高级错误处理(如指数退避重试)以及多租户管理。适用于构建高可靠、可扩展的语音转文本系统。
查看详情
语音转文本开发集成指南
wispr-ci-integration
jeremylongshore/claude-code-plugins-plus-skills
491
提供完整的Wispr Flow语音转文本API集成指南。本技能指导开发者如何将语音输入功能集成到开发工作流中,支持低延迟的WebSocket流式传输和REST API调用。适用于构建语音控制应用、实时代码或命令行指令的转录功能,确保在编程和开发场景下的准确性和稳定性。
查看详情
Wispr Flow语音转文本错误指南
wispr-common-errors
jeremylongshore/claude-code-plugins-plus-skills
132
本指南为开发者提供了Wispr Flow语音转文本API的全面错误处理和故障排除文档。它涵盖了WebSocket流式传输、REST API调用以及通用听写工作流中的常见问题。用户可以学习如何解决认证失败、网络断开和准确度低等错误,从而顺利集成语音能力。
查看详情
Wispr语音转文本核心流程
wispr-core-workflow-a
jeremylongshore/claude-code-plugins-plus-skills
255
本工作流提供了Wispr Flow语音转文本API的完整集成指南。它支持低延迟的WebSocket流式传输和REST API调用,适用于开发人员构建复杂的语音驱动应用,实现实时语音输入、转写和开发工具集成。
查看详情
1
2
下一页
语言
简体中文
English