登录
下载
Skill UI
浏览并发现
9987+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
音频生成
,共找到
35
条记录
默认排序
最新上传
最多下载
ElevenLabs TTS与声音克隆工作流
elevenlabs-core-workflow-a
jeremylongshore/claude-code-plugins-plus-skills
190
本流程实现了基于ElevenLabs的文本转语音(TTS)和声音克隆功能。用户可以利用该流程生成高质量、可控的语音内容,包括高级音色和风格调节。它支持从音频样本进行即时声音克隆,并提供WebSocket流式传输,适用于构建实时聊天机器人、直播或需要低延迟音频的应用场景。
查看详情
ElevenLabs TTS性能优化指南
elevenlabs-performance-tuning
jeremylongshore/claude-code-plugins-plus-skills
469
本指南提供了优化ElevenLabs TTS性能的完整技术方案。内容涵盖了如何通过模型选择(如Flash模型)、利用流媒体(Streaming)接口以及优化音频格式,来显著降低语音生成延迟和提高数据吞吐量。适用于实时对话、IVR系统和高并发的语音内容生成场景。
查看详情
Abridge集成错误诊断指南
abridge-common-errors
jeremylongshore/claude-code-plugins-plus-skills
493
本指南是Abridge临床文档集成环境的综合故障排除手册。它详细涵盖了认证、EHR连接、音频流、病历生成以及FHIR数据校验等一系列常见错误,帮助开发者和技术人员快速定位和解决AI驱动的临床工作流问题。
查看详情
Abridge AI性能调优
abridge-performance-tuning
jeremylongshore/claude-code-plugins-plus-skills
461
本工具提供结构化的方法和代码示例,用于优化Abridge的临床AI集成,特别针对高并发、大规模企业部署场景。它重点关注整个工作流的关键延迟降低,涵盖音频流传输、笔记生成流程和FHIR数据推送等多个环节,确保系统具备服务大型医疗机构的能力。
查看详情
高级音频处理与语音合成
elevenlabs-core-workflow-b
jeremylongshore/claude-code-plugins-plus-skills
232
本工作流提供了一套全面的专业音频处理解决方案。它集成了语音到语音转换(变声器)、文本生成音效、音频降噪隔离和语音转文字转录等多个高级功能。适用于内容创作、播客制作、音频编辑等需要高质量声音处理的场景。
查看详情
音频内容生成与合成
audio-jingle
nexu-io/open-design
146
这是一个专业的音频内容生成工具,能够根据需求生成高质量的配乐、片头、画外音和音效。它集成了多种主流AI模型,支持从简单的文本指令到复杂音乐结构(如情绪弧线)的完整流程,适用于市场营销、视频剪辑和多媒体内容制作。
查看详情
RunAPI AI模型命令行工具
runapi-cli
sickn33/antigravity-awesome-skills
93
RunAPI CLI是专用的执行层,用于与RunAPI的AI模型套件进行交互。它允许开发者通过命令行或CI/CD流程,程序化地生成多种模态内容,包括图片、视频和音频。用户可以使用它来提交单次任务、管理异步任务,并向各种服务(如Suno、Claude、Gemini)传递复杂的JSON请求体,是构建健壮AI自动化工作流的关键工具。
查看详情
音乐与歌唱工作室
music-and-singing-studio
opensquilla/opensquilla
195
本技能是一个专业的音频生成工具,能够根据用户需求,创作出高质量的纯音乐(BGM)、广告配乐、以及带有人声的完整歌曲。它支持生成原创歌词和配乐,适用于需要多样化音频素材的内容创作者,确保输出的是可播放的音频成品。
查看详情
静态图片转视频(AI失败回退)
video-still-animator
opensquilla/opensquilla
453
该技能可以将单张静态图片(PNG/JPG)通过Ken-Burns缩放平移效果,生成一段短视频。它主要设计用作自动化视频工作流的可靠回退机制。当上游AI视频生成步骤因内容审核失败(如面部识别或音频安全问题)时,此动画生成器可以确保生成一个有效的占位符片段,从而保证下游的合并步骤能够顺利完成最终成品,维持创作流程的连续性。
查看详情
语音克隆实验室:生成可重用音色
voice-clone-lab
opensquilla/opensquilla
91
该功能提供专业的语音克隆服务,能够从本地音频样本创建并注册可重用的虚拟声音。它严格遵循“先征得同意”的工作流,必须获取发言人身份、使用范围和样本来源的明确同意。适用于需要品牌一致性、高性能TTS、虚拟人内容或专业配音的场景。
查看详情
专业文字转语音配音工作室
voiceover-studio
opensquilla/opensquilla
146
这是一个专业的文本转语音(TTS)配音系统,能够将任何书面文本转化为高质量、自然流畅的音频内容。它支持多种应用场景,包括播客旁白、产品解说、IVR提示和短视频配音。系统具备高级功能,可根据用户指定的目标语言、地域口音、情绪和语速进行优化,确保生成的音频在不同文化背景下都自然准确。
查看详情
上一页
1
2
3
语言
简体中文
English