登录
下载
Skill UI
浏览并发现
9688+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
语音识别
,共找到
13
条记录
默认排序
最新上传
最多下载
Azure呼叫自动化(Java)
azure-communication-callautomation-java
sickn33/antigravity-awesome-skills
265
该Java SDK用于构建复杂的服务器端呼叫自动化工作流,基于Azure通信服务。它支持实现IVR系统、动态呼叫路由、媒体播放(TTS/音频)、语音识别、DTMF录音、呼叫录制和参与者管理。适用于构建智能客服机器人或自动化通知系统。
查看详情
Azure呼叫自动化(Java)
azure-communication-callautomation-java
sickn33/antigravity-awesome-skills
265
该Java SDK用于构建复杂的服务器端呼叫自动化工作流,基于Azure通信服务。它支持实现IVR系统、动态呼叫路由、媒体播放(TTS/音频)、语音识别、DTMF录音、呼叫录制和参与者管理。适用于构建智能客服机器人或自动化通知系统。
查看详情
Deepgram语音转录快速上手
deepgram-hello-world
jeremylongshore/claude-code-plugins-plus-skills
84
本示例提供了一个关于Deepgram语音转文本的最小化工作示例。它展示了如何使用TypeScript和Python两种语言,从URL或本地文件对音频进行转录。用户可以学习基本API模式,包括使用高级功能如说话人识别(Diarization)和选择最佳模型(如nova-3),非常适合初次集成和测试Deepgram服务。
查看详情
Deepgram本地开发调试流程
deepgram-local-dev-loop
jeremylongshore/claude-code-plugins-plus-skills
106
本指南旨在为Deepgram的语音识别应用建立一套完整的本地开发工作流。它指导用户如何设置测试音频夹具、模拟API响应(Mocking),并利用Vitest等工具进行单元和集成测试。适用于构建或调试依赖Deepgram服务的高效开发环境。
查看详情
Deepgram SDK升级与迁移指南
deepgram-upgrade-migration
jeremylongshore/claude-code-plugins-plus-skills
365
本指南为开发者提供了Deepgram SDK从旧版本(v3/v4)迁移到新版本(v5)的完整路线图。它详细介绍了版本升级的破坏性变更,包括API对比和最佳实践代码,并指导用户完成模型从Nova-2到Nova-3的升级,确保语音识别和文本合成流程的平稳过渡。
查看详情
Pipecat低延迟语音助手构建教程
pipecat-friday-agent
sickn33/antigravity-awesome-skills
344
本技能提供了一个完整的F.R.I.D.A.Y.(铁人战甲风格)语音助手的构建蓝图。它利用Pipecat框架,构建了一个低延迟的语音管道,流程包括语音识别(STT)、大型语言模型(LLM)和文本转语音(TTS),支持集成Gemini和OpenAI等多个AI服务商,适用于构建实时、多模态的对话系统。
查看详情
社工渗透测试
conducting-social-engineering-penetration-test
mukul975/Anthropic-Cybersecurity-Skills
172
设计并实施钓鱼、语音、短信和实地预设场景的社工渗透测试,实战验证员工安全防线并识别培训短板。
查看详情
Transloadit 媒体流水线
transloadit-media-processing
github/awesome-copilot
178
基于 Transloadit 云,调用 86+ 处理机器人批量处理视频、音频、图像与文档,支持转码、生成缩略图、裁剪加水印、OCR、语音识别与多步骤流水线,适合各种媒体自动化任务。
查看详情
Wispr Flow 语音转文本调试工具
wispr-debug-bundle
jeremylongshore/claude-code-plugins-plus-skills
416
本调试包旨在为开发者提供与 Wispr Flow 语音转文本 API 的全面集成指南。它覆盖了从低延迟 WebSocket 流媒体到标准 REST API 调用的各种最佳实践。适用于构建复杂的语音控制应用、听写工具,或任何需要稳定语音识别和错误处理机制的场景。
查看详情
Wispr Flow语音转文字API集成
wispr-deploy-integration
jeremylongshore/claude-code-plugins-plus-skills
487
本指南是Wispr Flow语音转文字API的集成文档,为开发人员提供构建语音驱动应用的技术指导。内容涵盖通过WebSocket或REST API实现语音流传输、实时听写,以及处理代码和开发术语的上下文识别,适用于构建高精度语音输入功能。
查看详情
Wispr Flow语音转文本API使用指南
wispr-rate-limits
jeremylongshore/claude-code-plugins-plus-skills
68
本指南为开发者提供了关于集成Wispr Flow语音转文本API的最佳实践和详细说明。内容涵盖速率限制管理、选择WebSocket流式传输和REST端点、处理常见错误代码(如401),以及优化上下文感知能力,尤其适用于提升代码和开发术语的识别准确性。是构建可靠、低延迟语音应用的关键参考资料。
查看详情
Wispr Flow语音转文本API安全指南
wispr-security-basics
jeremylongshore/claude-code-plugins-plus-skills
281
本指南为开发者提供了集成Wispr Flow语音转文本API的关键安全和技术指导。内容涵盖了API密钥、访问令牌等安全认证的最佳实践,以及如何使用WebSocket进行实时流式传输、处理常见的错误码和提高代码/开发语境下的识别准确性。
查看详情
1
2
下一页
语言
简体中文
English