登录
下载
Skill UI
浏览并发现
6069+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
字幕
,共找到
6
条记录
默认排序
最新上传
最多下载
Azure AI 语音转录
azure-ai-transcription-py
sickn33/antigravity-awesome-skills
242
提供 Python 客户端接入 Azure AI 转录,可实现实时与批量语音转文本、时间戳与说话人分离,适合会议纪要、字幕与存储在 Blob 的长音频。
查看详情
Azure AI 语音转录
azure-ai-transcription-py
sickn33/antigravity-awesome-skills
242
提供 Python 客户端接入 Azure AI 转录,可实现实时与批量语音转文本、时间戳与说话人分离,适合会议纪要、字幕与存储在 Blob 的长音频。
查看详情
Azure 视觉图像分析
azure-ai-vision-imageanalysis-py
sickn33/antigravity-awesome-skills
186
Azure AI Vision Python SDK 提供图像字幕、标签、目标检测、OCR、人物识别和智能裁剪等能力,便于理解与处理视觉素材。
查看详情
实时音频叙述生成
podcast-generation
sickn33/antigravity-awesome-skills
410
通过 Azure OpenAI 的 Realtime Mini 接口,将文本提示实时转为 PCM 音频、转换为 WAV 并以 base64 形式返给前端播放,支持虚拟主播语音选项和字幕输出,适用于播客或音频故事生成。
查看详情
Whisper多语音识别
whisper
Orchestra-Research/AI-Research-SKILLs
104
OpenAI 的 Whisper 提供多语种语音转写、英语翻译与语言识别,适配噪声环境、播客、会议等录音,可快速批量处理,还能生成字幕和支持 GPU 加速。
查看详情
VideoDB 媒体套件
videodb-skills
sickn33/antigravity-awesome-skills
384
VideoDB 技能通过 Python SDK 上传、转码、搜索与编辑视频,支持语音/画面检索、自动转录字幕、多段剪辑、AI 媒体生成与实时采集,输出可直接播放的流链接。
查看详情
1
语言
简体中文
English