下载

Skill UI

浏览并发现 9987+ 精选技能

全部编程开发人工智能设计创意产品商业数据科学市场营销职场通用效率工具硬件工程语言学习

搜索音频生成，共找到 35 条记录

默认排序最新上传最多下载

ElevenLabs TTS与声音克隆工作流

elevenlabs-core-workflow-a

jeremylongshore/claude-code-plugins-plus-skills

本流程实现了基于ElevenLabs的文本转语音（TTS）和声音克隆功能。用户可以利用该流程生成高质量、可控的语音内容，包括高级音色和风格调节。它支持从音频样本进行即时声音克隆，并提供WebSocket流式传输，适用于构建实时聊天机器人、直播或需要低延迟音频的应用场景。

ElevenLabs TTS性能优化指南

elevenlabs-performance-tuning

jeremylongshore/claude-code-plugins-plus-skills

本指南提供了优化ElevenLabs TTS性能的完整技术方案。内容涵盖了如何通过模型选择（如Flash模型）、利用流媒体（Streaming）接口以及优化音频格式，来显著降低语音生成延迟和提高数据吞吐量。适用于实时对话、IVR系统和高并发的语音内容生成场景。

Abridge集成错误诊断指南

abridge-common-errors

jeremylongshore/claude-code-plugins-plus-skills

本指南是Abridge临床文档集成环境的综合故障排除手册。它详细涵盖了认证、EHR连接、音频流、病历生成以及FHIR数据校验等一系列常见错误，帮助开发者和技术人员快速定位和解决AI驱动的临床工作流问题。

Abridge AI性能调优

abridge-performance-tuning

jeremylongshore/claude-code-plugins-plus-skills

本工具提供结构化的方法和代码示例，用于优化Abridge的临床AI集成，特别针对高并发、大规模企业部署场景。它重点关注整个工作流的关键延迟降低，涵盖音频流传输、笔记生成流程和FHIR数据推送等多个环节，确保系统具备服务大型医疗机构的能力。

高级音频处理与语音合成

elevenlabs-core-workflow-b

jeremylongshore/claude-code-plugins-plus-skills

本工作流提供了一套全面的专业音频处理解决方案。它集成了语音到语音转换（变声器）、文本生成音效、音频降噪隔离和语音转文字转录等多个高级功能。适用于内容创作、播客制作、音频编辑等需要高质量声音处理的场景。

音频内容生成与合成

nexu-io/open-design

这是一个专业的音频内容生成工具，能够根据需求生成高质量的配乐、片头、画外音和音效。它集成了多种主流AI模型，支持从简单的文本指令到复杂音乐结构（如情绪弧线）的完整流程，适用于市场营销、视频剪辑和多媒体内容制作。

RunAPI AI模型命令行工具

sickn33/antigravity-awesome-skills

RunAPI CLI是专用的执行层，用于与RunAPI的AI模型套件进行交互。它允许开发者通过命令行或CI/CD流程，程序化地生成多种模态内容，包括图片、视频和音频。用户可以使用它来提交单次任务、管理异步任务，并向各种服务（如Suno、Claude、Gemini）传递复杂的JSON请求体，是构建健壮AI自动化工作流的关键工具。

音乐与歌唱工作室

music-and-singing-studio

opensquilla/opensquilla

本技能是一个专业的音频生成工具，能够根据用户需求，创作出高质量的纯音乐（BGM）、广告配乐、以及带有人声的完整歌曲。它支持生成原创歌词和配乐，适用于需要多样化音频素材的内容创作者，确保输出的是可播放的音频成品。

静态图片转视频（AI失败回退）

video-still-animator

opensquilla/opensquilla

该技能可以将单张静态图片（PNG/JPG）通过Ken-Burns缩放平移效果，生成一段短视频。它主要设计用作自动化视频工作流的可靠回退机制。当上游AI视频生成步骤因内容审核失败（如面部识别或音频安全问题）时，此动画生成器可以确保生成一个有效的占位符片段，从而保证下游的合并步骤能够顺利完成最终成品，维持创作流程的连续性。

语音克隆实验室：生成可重用音色

voice-clone-lab

opensquilla/opensquilla

该功能提供专业的语音克隆服务，能够从本地音频样本创建并注册可重用的虚拟声音。它严格遵循“先征得同意”的工作流，必须获取发言人身份、使用范围和样本来源的明确同意。适用于需要品牌一致性、高性能TTS、虚拟人内容或专业配音的场景。

专业文字转语音配音工作室

voiceover-studio

opensquilla/opensquilla

这是一个专业的文本转语音（TTS）配音系统，能够将任何书面文本转化为高质量、自然流畅的音频内容。它支持多种应用场景，包括播客旁白、产品解说、IVR提示和短视频配音。系统具备高级功能，可根据用户指定的目标语言、地域口音、情绪和语速进行优化，确保生成的音频在不同文化背景下都自然准确。

语言