登录
下载
Skill UI
浏览并发现
9677+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
CAST AI
,共找到
8
条记录
默认排序
最新上传
最多下载
Azure AI语音转录服务SDK
azure-ai-transcription-py
sickn33/antigravity-awesome-skills
479
这是一个基于Python的Azure AI语音转写SDK。它支持实时流式和批处理两种模式的语音转文本功能。该工具可以实现带时间戳和说话人区分(Diarization)的转录,适用于自动化会议记录、播客内容处理、视频字幕生成等专业场景。
查看详情
Azure AI语音转录服务SDK
azure-ai-transcription-py
sickn33/antigravity-awesome-skills
479
这是一个基于Python的Azure AI语音转写SDK。它支持实时流式和批处理两种模式的语音转文本功能。该工具可以实现带时间戳和说话人区分(Diarization)的转录,适用于自动化会议记录、播客内容处理、视频字幕生成等专业场景。
查看详情
实时音频叙述生成
podcast-generation
sickn33/antigravity-awesome-skills
410
通过 Azure OpenAI 的 Realtime Mini 接口,将文本提示实时转为 PCM 音频、转换为 WAV 并以 base64 形式返给前端播放,支持虚拟主播语音选项和字幕输出,适用于播客或音频故事生成。
查看详情
Whisper 多语种语音识别
whisper
Orchestra-Research/AI-Research-SKILLs
298
Whisper 是 OpenAI 提供的多语种语音识别与英文翻译模型,支持 99 种语言、批量/流式转录及 GPU 加速,非常适合播客、会议、音视频转录和嘈杂环境下的多语言音频处理。
查看详情
开放笔记本研究中心
open-notebook
K-Dense-AI/claude-scientific-skills
494
开源自托管的研究平台,可替代NotebookLM,支持多源内容摄取、AI笔记、上下文对话、向量检索和多说话人播客生成,还提供REST API便于自动化。
查看详情
开放笔记本研究中心
open-notebook
K-Dense-AI/scientific-agent-skills
170
开源自托管的研究平台,可替代NotebookLM,支持多源内容摄取、AI笔记、上下文对话、向量检索和多说话人播客生成,还提供REST API便于自动化。
查看详情
高级音频处理与语音合成
elevenlabs-core-workflow-b
jeremylongshore/claude-code-plugins-plus-skills
232
本工作流提供了一套全面的专业音频处理解决方案。它集成了语音到语音转换(变声器)、文本生成音效、音频降噪隔离和语音转文字转录等多个高级功能。适用于内容创作、播客制作、音频编辑等需要高质量声音处理的场景。
查看详情
音频内容生成与合成
audio-jingle
nexu-io/open-design
146
这是一个专业的音频内容生成工具,能够根据需求生成高质量的配乐、片头、画外音和音效。它集成了多种主流AI模型,支持从简单的文本指令到复杂音乐结构(如情绪弧线)的完整流程,适用于市场营销、视频剪辑和多媒体内容制作。
查看详情
1
语言
简体中文
English