登录
下载
Skill UI
浏览并发现
10245+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
TTS
,共找到
35
条记录
默认排序
最新上传
最多下载
实时多模态AI智能体构建
daily
sickn33/antigravity-awesome-skills
472
这是一个用于构建生产级、低延迟的实时多模态AI智能体框架。它允许开发者在一个统一的管道中编排复杂的AI流程,无缝处理实时音频、视频和文本数据。核心功能包括集成多种AI服务(如LLM、语音识别、TTS),管理对话上下文,并支持函数调用,适用于构建高级交互式AI应用。
查看详情
蓝牙耳麦LLM语音交互应用
earllm-build
sickn33/antigravity-awesome-skills
198
这是一个用于构建EarLLM One应用的指南。该应用旨在连接蓝牙耳麦与大语言模型(LLM),通过语音管道实现实时人机交互。它负责复杂的音频采集(STT)、调用LLM进行推理,并将结果通过文字转语音(TTS)播放出来,涉及安卓系统的深层蓝牙和音频流处理技术。
查看详情
Pipecat低延迟语音助手构建教程
pipecat-friday-agent
sickn33/antigravity-awesome-skills
344
本技能提供了一个完整的F.R.I.D.A.Y.(铁人战甲风格)语音助手的构建蓝图。它利用Pipecat框架,构建了一个低延迟的语音管道,流程包括语音识别(STT)、大型语言模型(LLM)和文本转语音(TTS),支持集成Gemini和OpenAI等多个AI服务商,适用于构建实时、多模态的对话系统。
查看详情
演示视频制作流程
demo-video
alirezarezvani/claude-skills
492
从截图或场景描述制作精致演示视频,协调 Playwright 抓图、edge-tts 旁白与 ffmpeg 合成,强调故事节奏与每帧的单一焦点,适用于产品介绍、营销短片与功能演示。
查看详情
文本内容播客音频生成
podcast-generation
bytedance/deer-flow
319
该技能能够将任何文本内容(如文章、报告)转换为高质量、自然的双人对话式播客音频。它首先将文本内容转化为结构化的JSON脚本,随后利用先进的TTS技术合成语音,生成最终的MP3文件。支持中英文两种语言,使内容易于听众收听。
查看详情
ElevenLabs TTS与声音克隆工作流
elevenlabs-core-workflow-a
jeremylongshore/claude-code-plugins-plus-skills
190
本流程实现了基于ElevenLabs的文本转语音(TTS)和声音克隆功能。用户可以利用该流程生成高质量、可控的语音内容,包括高级音色和风格调节。它支持从音频样本进行即时声音克隆,并提供WebSocket流式传输,适用于构建实时聊天机器人、直播或需要低延迟音频的应用场景。
查看详情
ElevenLabs TTS性能优化指南
elevenlabs-performance-tuning
jeremylongshore/claude-code-plugins-plus-skills
469
本指南提供了优化ElevenLabs TTS性能的完整技术方案。内容涵盖了如何通过模型选择(如Flash模型)、利用流媒体(Streaming)接口以及优化音频格式,来显著降低语音生成延迟和提高数据吞吐量。适用于实时对话、IVR系统和高并发的语音内容生成场景。
查看详情
ElevenLabs速率限制与配额管理
elevenlabs-rate-limits
jeremylongshore/claude-code-plugins-plus-skills
371
本技能提供了一套完整的ElevenLabs API调用管理方案,用于处理复杂的速率限制、并发控制和配额监控。它实现了根据用户套餐级别的并发队列管理,并在系统过载时应用指数退避(Exponential Backoff),确保了TTS应用处理高并发请求的稳定性和可靠性。
查看详情
ElevenLabs CI/CD 测试配置
elevenlabs-ci-integration
jeremylongshore/claude-code-plugins-plus-skills
467
本指南提供了为ElevenLabs集成配置CI/CD流水线的方法。它采用双层测试策略:在每次推送时运行模拟单元测试以避免消耗API配额,仅在主分支或手动触发时运行实际集成测试。适用于需要自动化验证TTS项目的开发者。
查看详情
ElevenLabs API错误诊断与修复
elevenlabs-common-errors
jeremylongshore/claude-code-plugins-plus-skills
477
本指南是ElevenLabs API错误故障排除的快速参考手册。它按HTTP状态码组织了常见的错误类型(如401未认证、429过载等),并提供了详细的错误原因、解决方案和调试命令。帮助开发者快速定位并解决TTS、语音克隆等API调用中的连接、配额或参数问题。
查看详情
ElevenLabs成本优化与配额监控
elevenlabs-cost-tuning
jeremylongshore/claude-code-plugins-plus-skills
446
本技能旨在帮助用户优化 ElevenLabs 语音合成(TTS)的运行成本。它提供了一套完整的流程,包括基于成本的模型选择、通过优化文本内容来减少计费字符数,以及实现实时的配额使用监控和预算预警。适用于构建高并发、对成本敏感的语音应用。
查看详情
ElevenLabs TTS云端部署指南
elevenlabs-deploy-integration
jeremylongshore/claude-code-plugins-plus-skills
102
本技能提供将 ElevenLabs TTS 应用部署到主流云平台(如 Vercel, Fly.io, Cloud Run)的完整指南。内容涵盖了服务器无服务器部署、容器化部署、密钥安全管理、以及实现实时流媒体音频流的最佳实践,适用于构建生产级的语音合成应用。
查看详情
上一页
1
2
3
下一页
语言
简体中文
English