登录
下载
Skill UI
浏览并发现
6006+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
字幕
,共找到
10
条记录
默认排序
最新上传
最多下载
Azure AI 语音转录
azure-ai-transcription-py
sickn33/antigravity-awesome-skills
242
提供 Python 客户端接入 Azure AI 转录,可实现实时与批量语音转文本、时间戳与说话人分离,适合会议纪要、字幕与存储在 Blob 的长音频。
查看详情
Azure AI 语音转录
azure-ai-transcription-py
sickn33/antigravity-awesome-skills
242
提供 Python 客户端接入 Azure AI 转录,可实现实时与批量语音转文本、时间戳与说话人分离,适合会议纪要、字幕与存储在 Blob 的长音频。
查看详情
Azure 视觉图像分析
azure-ai-vision-imageanalysis-py
sickn33/antigravity-awesome-skills
186
Azure AI Vision Python SDK 提供图像字幕、标签、目标检测、OCR、人物识别和智能裁剪等能力,便于理解与处理视觉素材。
查看详情
实时音频叙述生成
podcast-generation
sickn33/antigravity-awesome-skills
410
通过 Azure OpenAI 的 Realtime Mini 接口,将文本提示实时转为 PCM 音频、转换为 WAV 并以 base64 形式返给前端播放,支持虚拟主播语音选项和字幕输出,适用于播客或音频故事生成。
查看详情
Remotion 视频最佳实践
remotion-best-practices
sickn33/antigravity-awesome-skills
333
为 React 上的 Remotion 视频开发提供全套规范,包括素材导入、音频处理、字幕、动画、过渡、Tailwind 集成、元数据、字体、帧提取与时间控制等内容,助力打造专业级作品。
查看详情
Whisper多语音识别
whisper
Orchestra-Research/AI-Research-SKILLs
104
OpenAI 的 Whisper 提供多语种语音转写、英语翻译与语言识别,适配噪声环境、播客、会议等录音,可快速批量处理,还能生成字幕和支持 GPU 加速。
查看详情
YouTube 视频摘要器
youtube-summarizer
sickn33/antigravity-awesome-skills
403
从 YouTube 视频中提取字幕,并应用 STAR+R-I-S-E 框架,生成详尽文档,记录所有洞察、论点和要点,方便教学或研究内容参考,无需重看。
查看详情
VideoDB 媒体套件
videodb-skills
sickn33/antigravity-awesome-skills
384
VideoDB 技能通过 Python SDK 上传、转码、搜索与编辑视频,支持语音/画面检索、自动转录字幕、多段剪辑、AI 媒体生成与实时采集,输出可直接播放的流链接。
查看详情
VideoDB 媒体智能中心
videodb
sickn33/antigravity-awesome-skills
422
VideoDB 可采集桌面、文件或 RTSP 流,完成转码、索引、搜索、时间线编辑与字幕覆盖,提供可播放证据、事件告警与会话总结,适合媒体监控与复盘场景。
查看详情
视频数据库操控
videodb
affaan-m/everything-claude-code
411
VideoDB 媒体操控可接入本地/URL/RTSP/桌面录制,实时理解画面与语音、索引关键帧、转码标准化、时间线编辑、生成字幕音频图像,并基于索引或事件发出告警。
查看详情
1
语言
简体中文
English