下载

Skill UI

浏览并发现 9167+ 精选技能

全部编程开发人工智能设计创意产品商业数据科学市场营销职场通用效率工具硬件工程语言学习

搜索语音转文本，共找到 22 条记录

默认排序最新上传最多下载

Deepgram API 错误排查指南

deepgram-common-errors

jeremylongshore/claude-code-plugins-plus-skills

本指南全面收录了Deepgram API的常见错误代码（HTTP/WebSocket），提供了从API密钥验证、音频格式优化到代码重试机制的排障流程。是开发人员进行语音转文本（STT）服务集成的必备参考资料。

Deepgram语音转录快速上手

deepgram-hello-world

jeremylongshore/claude-code-plugins-plus-skills

本示例提供了一个关于Deepgram语音转文本的最小化工作示例。它展示了如何使用TypeScript和Python两种语言，从URL或本地文件对音频进行转录。用户可以学习基本API模式，包括使用高级功能如说话人识别（Diarization）和选择最佳模型（如nova-3），非常适合初次集成和测试Deepgram服务。

Deepgram SDK 生产最佳实践

deepgram-sdk-patterns

jeremylongshore/claude-code-plugins-plus-skills

为使用 TypeScript 和 Python 集成 Deepgram 提供了生产级别的代码模式和最佳实践。本指南涵盖了单例客户端管理、Aura 文本转语音合成，以及复杂的音频智能流程（如摘要、话题和情感分析）。适用于任何需要构建健壮、标准化的 Deepgram 集成系统，或进行代码重构和版本升级的开发者。

ElevenLabs 语音自动化

elevenlabs-automation

ComposioHQ/awesome-claude-skills

通过 Composio MCP 一键驱动 ElevenLabs 文本转语音工作流：生成语音、查看音色/模型、核对订阅额度、流式播放并重取历史音频。

Pipecat低延迟语音助手构建教程

pipecat-friday-agent

sickn33/antigravity-awesome-skills

本技能提供了一个完整的F.R.I.D.A.Y.（铁人战甲风格）语音助手的构建蓝图。它利用Pipecat框架，构建了一个低延迟的语音管道，流程包括语音识别(STT)、大型语言模型(LLM)和文本转语音(TTS)，支持集成Gemini和OpenAI等多个AI服务商，适用于构建实时、多模态的对话系统。

AssemblyAI转录成本优化指南

assemblyai-cost-tuning

jeremylongshore/claude-code-plugins-plus-skills

本技能旨在提供一套完整的AssemblyAI成本优化指南。它详细说明了如何在语音转文本过程中，通过模型选择、功能模块预算（如说话人分离、情感分析）和成本估算，最大限度地降低转录费用。适用于需要精细化成本控制和高效率资源管理的商业项目。

AssemblyAI生产级架构设计

assemblyai-reference-architecture

jeremylongshore/claude-code-plugins-plus-skills

本文件提供了基于AssemblyAI的生产级转录服务参考架构。它遵循分层设计原则，覆盖了从API接口、服务逻辑到Webhook处理、批量任务和LeMUR高级分析的完整流程。适用于需要构建高可靠性、可扩展语音转文本系统的开发场景。

AssemblyAI CI/CD集成测试指南

assemblyai-ci-integration

jeremylongshore/claude-code-plugins-plus-skills

本指南提供了一套完整的AssemblyAI CI/CD集成方案，用于自动化测试语音转文本项目。它详细介绍了如何使用GitHub Actions配置工作流，包含无成本的本地单元测试（Mocked）和受控的实测集成测试。确保您的转录服务在自动化构建流程中保持稳定和可靠。

AssemblyAI SDK 生产级模式

assemblyai-sdk-patterns

jeremylongshore/claude-code-plugins-plus-skills

本指南提供了在TypeScript和Python中集成AssemblyAI SDK的生产级架构模式。内容涵盖单例客户端实现、服务封装、高级错误处理（如指数退避重试）以及多租户管理。适用于构建高可靠、可扩展的语音转文本系统。

语音转文本开发集成指南

wispr-ci-integration

jeremylongshore/claude-code-plugins-plus-skills

提供完整的Wispr Flow语音转文本API集成指南。本技能指导开发者如何将语音输入功能集成到开发工作流中，支持低延迟的WebSocket流式传输和REST API调用。适用于构建语音控制应用、实时代码或命令行指令的转录功能，确保在编程和开发场景下的准确性和稳定性。

Wispr Flow语音转文本错误指南

wispr-common-errors

jeremylongshore/claude-code-plugins-plus-skills

本指南为开发者提供了Wispr Flow语音转文本API的全面错误处理和故障排除文档。它涵盖了WebSocket流式传输、REST API调用以及通用听写工作流中的常见问题。用户可以学习如何解决认证失败、网络断开和准确度低等错误，从而顺利集成语音能力。

Wispr语音转文本核心流程

wispr-core-workflow-a

jeremylongshore/claude-code-plugins-plus-skills

本工作流提供了Wispr Flow语音转文本API的完整集成指南。它支持低延迟的WebSocket流式传输和REST API调用，适用于开发人员构建复杂的语音驱动应用，实现实时语音输入、转写和开发工具集成。

语言