登录
下载
Skill UI
浏览并发现
9118+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
转文本
,共找到
21
条记录
默认排序
最新上传
最多下载
Azure AI语音转录服务SDK
azure-ai-transcription-py
sickn33/antigravity-awesome-skills
479
这是一个基于Python的Azure AI语音转写SDK。它支持实时流式和批处理两种模式的语音转文本功能。该工具可以实现带时间戳和说话人区分(Diarization)的转录,适用于自动化会议记录、播客内容处理、视频字幕生成等专业场景。
查看详情
Azure AI语音转录服务SDK
azure-ai-transcription-py
sickn33/antigravity-awesome-skills
479
这是一个基于Python的Azure AI语音转写SDK。它支持实时流式和批处理两种模式的语音转文本功能。该工具可以实现带时间戳和说话人区分(Diarization)的转录,适用于自动化会议记录、播客内容处理、视频字幕生成等专业场景。
查看详情
Azure AI文本翻译SDK(Python)
azure-ai-translation-text-py
sickn33/antigravity-awesome-skills
150
这是一个用于与Azure AI Translator服务交互的Python客户端库。它提供了完整的文本翻译、语言自动检测、字符转写(Transliteration)和词典查询等功能。适用于需要处理多语言内容、实现跨文化交流的应用程序开发。
查看详情
Azure AI文本翻译SDK(Python)
azure-ai-translation-text-py
sickn33/antigravity-awesome-skills
150
这是一个用于与Azure AI Translator服务交互的Python客户端库。它提供了完整的文本翻译、语言自动检测、字符转写(Transliteration)和词典查询等功能。适用于需要处理多语言内容、实现跨文化交流的应用程序开发。
查看详情
Azure AI 翻译 SDK (类型脚本)
azure-ai-translation-ts
sickn33/antigravity-awesome-skills
232
该SDK为开发者提供了基于TypeScript的Azure AI翻译服务集成工具。它集成了强大的文本翻译(支持语言检测、转写)和文档翻译功能。开发者可以轻松实现单个文档的翻译,或管理复杂的批量翻译任务,支持将多语言能力集成到各类应用中。
查看详情
Azure语音转文本API
azure-speech-to-text-rest-py
sickn33/antigravity-awesome-skills
60
这是一个使用Python和REST API实现的Azure语音转文本功能。它允许用户通过HTTP请求,对时长不超过60秒的音频文件进行语音识别转录。该工具无需依赖官方SDK,适用于需要快速集成语音识别功能的开发场景,并支持分块传输以降低延迟。
查看详情
Deepgram SDK安装与认证
deepgram-install-auth
jeremylongshore/claude-code-plugins-plus-skills
89
本技能提供了针对Node.js和Python环境的Deepgram SDK的完整安装和配置指南。内容涵盖了安全的环境变量API密钥管理、客户端初始化以及连接验证。适用于需要将Deepgram强大的语音转文本(STT)和文本转语音(TTS)功能集成到新项目中的开发者。
查看详情
文本语音音频处理
fal-audio
sickn33/antigravity-awesome-skills
83
本技能利用fal.ai模型提供双向音频处理能力。它支持文本转语音(TTS),将文字转换为自然语音;以及语音转文本(STT),将语音准确转录为文字。适用于需要处理音频输入分析或合成语音输出的场景,如语音助手、内容数字化或多语言应用。
查看详情
AI图像与视频生成
fal-generate
sickn33/antigravity-awesome-skills
398
利用fal.ai AI模型,本技能可以实现高质量的图像和视频内容生成。适用于所有需要创意视觉素材、进行多媒体内容创作或概念原型设计的场景。核心功能是将文本描述转化为复杂的视觉媒体。
查看详情
Groq多模态工作流:语音、图像、语音合成
groq-core-workflow-b
jeremylongshore/claude-code-plugins-plus-skills
122
该工作流是基于Groq的综合多模态解决方案,超越了基础的聊天补全功能。它支持超快速的音频转录(Whisper),利用视觉模型进行图像理解,以及高质量的文本转语音合成。适用于实时内容处理、多媒体分析和自动化内容生成等场景。
查看详情
Kling AI 文本转视频生成
klingai-text-to-video
jeremylongshore/claude-code-plugins-plus-skills
358
该工具提供Kling AI API,允许用户通过文本描述生成高质量、电影级的视频内容。它支持专业模式、摄像机控制(如平移、倾斜、缩放)和音频同步,非常适合需要构建专业文本到视频生成工作流的内容创作者和开发者。
查看详情
实时音频叙述生成
podcast-generation
sickn33/antigravity-awesome-skills
410
通过 Azure OpenAI 的 Realtime Mini 接口,将文本提示实时转为 PCM 音频、转换为 WAV 并以 base64 形式返给前端播放,支持虚拟主播语音选项和字幕输出,适用于播客或音频故事生成。
查看详情
1
2
下一页
语言
简体中文
English