登录
下载
Skill UI
浏览并发现
9688+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
文本合成
,共找到
15
条记录
默认排序
最新上传
最多下载
Deepgram SDK 生产最佳实践
deepgram-sdk-patterns
jeremylongshore/claude-code-plugins-plus-skills
421
为使用 TypeScript 和 Python 集成 Deepgram 提供了生产级别的代码模式和最佳实践。本指南涵盖了单例客户端管理、Aura 文本转语音合成,以及复杂的音频智能流程(如摘要、话题和情感分析)。适用于任何需要构建健壮、标准化的 Deepgram 集成系统,或进行代码重构和版本升级的开发者。
查看详情
Deepgram SDK升级与迁移指南
deepgram-upgrade-migration
jeremylongshore/claude-code-plugins-plus-skills
365
本指南为开发者提供了Deepgram SDK从旧版本(v3/v4)迁移到新版本(v5)的完整路线图。它详细介绍了版本升级的破坏性变更,包括API对比和最佳实践代码,并指导用户完成模型从Nova-2到Nova-3的升级,确保语音识别和文本合成流程的平稳过渡。
查看详情
文本语音音频处理
fal-audio
sickn33/antigravity-awesome-skills
83
本技能利用fal.ai模型提供双向音频处理能力。它支持文本转语音(TTS),将文字转换为自然语音;以及语音转文本(STT),将语音准确转录为文字。适用于需要处理音频输入分析或合成语音输出的场景,如语音助手、内容数字化或多语言应用。
查看详情
Groq多模态工作流:语音、图像、语音合成
groq-core-workflow-b
jeremylongshore/claude-code-plugins-plus-skills
122
该工作流是基于Groq的综合多模态解决方案,超越了基础的聊天补全功能。它支持超快速的音频转录(Whisper),利用视觉模型进行图像理解,以及高质量的文本转语音合成。适用于实时内容处理、多媒体分析和自动化内容生成等场景。
查看详情
Kling AI视频生成生产级开发套件
klingai-sdk-patterns
jeremylongshore/claude-code-plugins-plus-skills
223
这是一个生产就绪的Python SDK,用于提供与Kling AI API集成的完整模式。它封装了JWT自动刷新、结构化请求/响应模型、长任务的指数退避轮询机制以及详细的错误处理。适用于构建稳定、高可靠性、需要高级文本或图像到视频合成能力的应用程序。
查看详情
AI图像生成与编辑工具
nano-banana-pro-openrouter
github/awesome-copilot
435
该工具利用OpenRouter和Gemini 3 Pro Image模型,提供强大的图像创作能力。支持纯文本提示生成、对现有图像进行精细编辑,以及多图元素合成。用户可自定义分辨率(最高4K),适用于专业设计和创意工作流,实现从概念到高质量图像的完整流程。
查看详情
深度伪造检测与媒体溯源
resemble-detect
Prat011/awesome-llm-skills
235
该技能提供全面的媒体情报分析能力,用于检测音频、图像、视频和文本中的合成操纵和AI生成内容。它可以进行深度伪造检测、追踪内容原始生成来源、应用与检测水印,并验证说话人身份,确保媒体的真实性和可信度。
查看详情
高级音频处理与语音合成
elevenlabs-core-workflow-b
jeremylongshore/claude-code-plugins-plus-skills
232
本工作流提供了一套全面的专业音频处理解决方案。它集成了语音到语音转换(变声器)、文本生成音效、音频降噪隔离和语音转文字转录等多个高级功能。适用于内容创作、播客制作、音频编辑等需要高质量声音处理的场景。
查看详情
ElevenLabs成本优化与配额监控
elevenlabs-cost-tuning
jeremylongshore/claude-code-plugins-plus-skills
446
本技能旨在帮助用户优化 ElevenLabs 语音合成(TTS)的运行成本。它提供了一套完整的流程,包括基于成本的模型选择、通过优化文本内容来减少计费字符数,以及实现实时的配额使用监控和预算预警。适用于构建高并发、对成本敏感的语音应用。
查看详情
ElevenLabs语音合成API指南
elevenlabs-hello-world
jeremylongshore/claude-code-plugins-plus-skills
224
本技能提供了一份完整的ElevenLabs语音合成API使用指南。内容涵盖使用TypeScript、Python和cURL等多种方式,实现文本到语音的高质量转换。用户可以学习如何精细控制语音参数、选择不同模型(如低延迟流式传输),适用于各类需要高质量语音内容生成的应用开发。
查看详情
ElevenLabs API认证与配置
elevenlabs-install-auth
jeremylongshore/claude-code-plugins-plus-skills
255
本指南详细介绍了如何在Node.js和Python环境中安装并配置ElevenLabs SDK。内容涵盖了如何使用环境变量设置API密钥、初始化客户端连接,并通过列出可用音色等方式进行连接验证。适用于所有需要集成高级文本转语音(TTS)或语音合成功能的开发场景。
查看详情
本地离线文本转语音与声音克隆
local-tts
jeremylongshore/claude-code-plugins-plus-skills
405
本技能基于VoxCPM2模型实现本地离线文本转语音合成。支持30种语言,提供三种先进模式:标准语音合成、描述式声音设计,以及从用户提供的参考音频进行声音克隆。所有处理均在本地设备上完成,无需任何API调用或网络连接,非常适合制作高质量的视频旁白、播客音频或语音消息。
查看详情
1
2
下一页
语言
简体中文
English