登录
下载
Skill UI
浏览并发现
9688+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
语音转录
,共找到
29
条记录
默认排序
最新上传
最多下载
Azure AI语音转录服务SDK
azure-ai-transcription-py
sickn33/antigravity-awesome-skills
479
这是一个基于Python的Azure AI语音转写SDK。它支持实时流式和批处理两种模式的语音转文本功能。该工具可以实现带时间戳和说话人区分(Diarization)的转录,适用于自动化会议记录、播客内容处理、视频字幕生成等专业场景。
查看详情
Azure AI语音转录服务SDK
azure-ai-transcription-py
sickn33/antigravity-awesome-skills
479
这是一个基于Python的Azure AI语音转写SDK。它支持实时流式和批处理两种模式的语音转文本功能。该工具可以实现带时间戳和说话人区分(Diarization)的转录,适用于自动化会议记录、播客内容处理、视频字幕生成等专业场景。
查看详情
Azure语音转文本API
azure-speech-to-text-rest-py
sickn33/antigravity-awesome-skills
60
这是一个使用Python和REST API实现的Azure语音转文本功能。它允许用户通过HTTP请求,对时长不超过60秒的音频文件进行语音识别转录。该工具无需依赖官方SDK,适用于需要快速集成语音识别功能的开发场景,并支持分块传输以降低延迟。
查看详情
Deepgram实时流式语音转录
deepgram-core-workflow-b
jeremylongshore/claude-code-plugins-plus-skills
451
本指南展示了如何使用Deepgram的WebSocket API实现稳定、低延迟的实时流式语音转录。内容涵盖了麦克风输入采集、说话人指纹识别(diarization)、语句结束检测以及自动重连机制。适用于构建专业的语音助手、直播字幕系统或实时语音AI应用。
查看详情
Deepgram语音转录快速上手
deepgram-hello-world
jeremylongshore/claude-code-plugins-plus-skills
84
本示例提供了一个关于Deepgram语音转文本的最小化工作示例。它展示了如何使用TypeScript和Python两种语言,从URL或本地文件对音频进行转录。用户可以学习基本API模式,包括使用高级功能如说话人识别(Diarization)和选择最佳模型(如nova-3),非常适合初次集成和测试Deepgram服务。
查看详情
Deepgram 转录服务迁移指南
deepgram-migration-deep-dive
jeremylongshore/claude-code-plugins-plus-skills
449
本指南详细介绍了从多个主流语音转录服务提供商(如 AWS Transcribe、Google STT、Whisper 等)迁移到 Deepgram 的流程。它提供了全面的功能对标和适配器模式实现,帮助开发者平稳、可靠地切换转录服务,确保项目连续性和数据完整性。
查看详情
Deepgram可扩展语音转录架构
deepgram-reference-architecture
jeremylongshore/claude-code-plugins-plus-skills
488
本模块提供了基于Deepgram的可扩展转录系统参考架构。涵盖了同步REST(短文件)、异步队列(批量处理)、WebSocket实时流媒体和混合路由器等四种主流模式,指导开发者根据不同的音频工作负载选择最合适的系统架构。
查看详情
Deepgram异步转写回调处理
deepgram-webhooks-events
jeremylongshore/claude-code-plugins-plus-skills
191
本教程指导如何实现Deepgram的异步转写回调处理。它涵盖了从提交音频任务到设置安全的Webhook接收端点(包含HMAC签名验证),再到利用Redis进行任务状态跟踪的全流程。适用于需要处理延迟或批量语音转录结果的后端系统开发。
查看详情
文本语音音频处理
fal-audio
sickn33/antigravity-awesome-skills
83
本技能利用fal.ai模型提供双向音频处理能力。它支持文本转语音(TTS),将文字转换为自然语音;以及语音转文本(STT),将语音准确转录为文字。适用于需要处理音频输入分析或合成语音输出的场景,如语音助手、内容数字化或多语言应用。
查看详情
Fireflies会议记录分析提取
fireflies-core-workflow-a
jeremylongshore/claude-code-plugins-plus-skills
394
该工作流通过GraphQL连接Fireflies.ai API,获取详细的会议转录记录。它能够处理发言人区分的语音数据,并提取结构化的关键洞察,包括行动项、关键主题、情绪分析和发言人贡献度。适用于构建完整的会议情报系统,实现从会议录音到可执行知识点的自动化提取。
查看详情
Groq多模态工作流:语音、图像、语音合成
groq-core-workflow-b
jeremylongshore/claude-code-plugins-plus-skills
122
该工作流是基于Groq的综合多模态解决方案,超越了基础的聊天补全功能。它支持超快速的音频转录(Whisper),利用视觉模型进行图像理解,以及高质量的文本转语音合成。适用于实时内容处理、多媒体分析和自动化内容生成等场景。
查看详情
智能会议转录与总结
twinmind-hello-world
jeremylongshore/claude-code-plugins-plus-skills
482
本技能用于录制和处理各类会议(如Zoom/Meet/Teams)或语音备忘录。它能生成带有时间戳的完整转录文本,并利用高级AI自动提取结构化的会议摘要、可执行任务清单(包含负责人和截止日期)和关键讨论点,帮助用户高效记录和跟进项目进展。
查看详情
1
2
3
下一页
语言
简体中文
English