登录
下载
Skill UI
浏览并发现
10410+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
音频
,共找到
106
条记录
默认排序
最新上传
最多下载
音频转录与会议纪要
audio-transcriber
sickn33/antigravity-awesome-skills
299
将录音转换为结构化 Markdown 文档,附带说话人、时间戳、字幕和会议摘要,适用于会议、访谈、课程等场景的快速记录。
查看详情
音频转录与会议纪要
audio-transcriber
sickn33/antigravity-awesome-skills
299
将录音转换为结构化 Markdown 文档,附带说话人、时间戳、字幕和会议摘要,适用于会议、访谈、课程等场景的快速记录。
查看详情
AudioCraft 音频生成指南
audiocraft-audio-generation
Orchestra-Research/AI-Research-SKILLs
336
AudioCraft 是 Meta 的 PyTorch 工具包,结合 MusicGen、AudioGen 和 EnCodec,通过文本生成音乐或音效,非常适合快速构建音乐应用、可控音效与立体声作品。
查看详情
AudioCraft 音频生成指南
audiocraft-audio-generation
Orchestra-Research/AI-Research-SKILLs
336
AudioCraft 是 Meta 的 PyTorch 工具包,结合 MusicGen、AudioGen 和 EnCodec,通过文本生成音乐或音效,非常适合快速构建音乐应用、可控音效与立体声作品。
查看详情
Azure多模态内容理解SDK
azure-ai-contentunderstanding-py
sickn33/antigravity-awesome-skills
227
该SDK提供了与Azure AI内容理解的编程接口,支持从多种多模态源(包括文档、图片、音频和视频)中提取结构化和语义内容。它不仅支持使用预构建的分析器(如发票、文档搜索),还允许用户创建自定义分析器,以实现高度定制化的数据提取,适用于RAG和自动化工作流。
查看详情
Azure多模态内容理解SDK
azure-ai-contentunderstanding-py
sickn33/antigravity-awesome-skills
227
该SDK提供了与Azure AI内容理解的编程接口,支持从多种多模态源(包括文档、图片、音频和视频)中提取结构化和语义内容。它不仅支持使用预构建的分析器(如发票、文档搜索),还允许用户创建自定义分析器,以实现高度定制化的数据提取,适用于RAG和自动化工作流。
查看详情
Azure AI 语音实时交互开发套件
azure-ai-voicelive-dotnet
sickn33/antigravity-awesome-skills
312
该SDK专为.NET开发者设计,用于构建实时的双向语音AI应用。它支持通过WebSocket进行通信,能够处理音频和文本流事件,并支持如函数调用等高级功能,是开发复杂虚拟助手和实时语音交互系统的理想工具。
查看详情
Azure 实时语音AI开发SDK
azure-ai-voicelive-py
sickn33/antigravity-awesome-skills
105
该SDK用于构建实时、双向的语音AI应用,通过WebSocket支持实时的语音流媒体通信。它允许开发者将麦克风音频输入模型,并接收合成语音输出。适用于开发智能语音助手、交互式语音系统和呼叫中心解决方案。
查看详情
Azure AI实时语音助理开发套件
azure-ai-voicelive-ts
sickn33/antigravity-awesome-skills
316
这是一个用于构建实时、双向语音AI应用的SDK。它通过WebSocket支持音视频流传输,能够处理用户语音输入、AI回复文本和音频流,并提供完整的会话管理功能。适用于在Node.js或浏览器环境中开发功能强大的语音助手和交互式AI代理。
查看详情
Azure呼叫自动化(Java)
azure-communication-callautomation-java
sickn33/antigravity-awesome-skills
265
该Java SDK用于构建复杂的服务器端呼叫自动化工作流,基于Azure通信服务。它支持实现IVR系统、动态呼叫路由、媒体播放(TTS/音频)、语音识别、DTMF录音、呼叫录制和参与者管理。适用于构建智能客服机器人或自动化通知系统。
查看详情
Azure呼叫自动化(Java)
azure-communication-callautomation-java
sickn33/antigravity-awesome-skills
265
该Java SDK用于构建复杂的服务器端呼叫自动化工作流,基于Azure通信服务。它支持实现IVR系统、动态呼叫路由、媒体播放(TTS/音频)、语音识别、DTMF录音、呼叫录制和参与者管理。适用于构建智能客服机器人或自动化通知系统。
查看详情
Azure语音转文本API
azure-speech-to-text-rest-py
sickn33/antigravity-awesome-skills
60
这是一个使用Python和REST API实现的Azure语音转文本功能。它允许用户通过HTTP请求,对时长不超过60秒的音频文件进行语音识别转录。该工具无需依赖官方SDK,适用于需要快速集成语音识别功能的开发场景,并支持分块传输以降低延迟。
查看详情
1
2
3
4
...
7
8
9
下一页
语言
简体中文
English