登录
下载
Skill UI
浏览并发现
9967+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
合成
,共找到
17
条记录
默认排序
最新上传
最多下载
Azure 实时语音AI开发SDK
azure-ai-voicelive-py
sickn33/antigravity-awesome-skills
105
该SDK用于构建实时、双向的语音AI应用,通过WebSocket支持实时的语音流媒体通信。它允许开发者将麦克风音频输入模型,并接收合成语音输出。适用于开发智能语音助手、交互式语音系统和呼叫中心解决方案。
查看详情
文本语音音频处理
fal-audio
sickn33/antigravity-awesome-skills
83
本技能利用fal.ai模型提供双向音频处理能力。它支持文本转语音(TTS),将文字转换为自然语音;以及语音转文本(STT),将语音准确转录为文字。适用于需要处理音频输入分析或合成语音输出的场景,如语音助手、内容数字化或多语言应用。
查看详情
Groq多模态工作流:语音、图像、语音合成
groq-core-workflow-b
jeremylongshore/claude-code-plugins-plus-skills
122
该工作流是基于Groq的综合多模态解决方案,超越了基础的聊天补全功能。它支持超快速的音频转录(Whisper),利用视觉模型进行图像理解,以及高质量的文本转语音合成。适用于实时内容处理、多媒体分析和自动化内容生成等场景。
查看详情
Kling AI视频生成生产级开发套件
klingai-sdk-patterns
jeremylongshore/claude-code-plugins-plus-skills
223
这是一个生产就绪的Python SDK,用于提供与Kling AI API集成的完整模式。它封装了JWT自动刷新、结构化请求/响应模型、长任务的指数退避轮询机制以及详细的错误处理。适用于构建稳定、高可靠性、需要高级文本或图像到视频合成能力的应用程序。
查看详情
AI驱动的研究架构设计
perplexity-reference-architecture
jeremylongshore/claude-code-plugins-plus-skills
278
本技能提供了一套完整的、模仿Perplexity的AI搜索和研究系统参考架构。它涵盖了搜索服务(模型路由、缓存)、引用文献处理(提取、验证)和研究编排器(多查询合成)三个核心模块,适用于构建复杂的、增强搜索能力的AI应用和系统设计。
查看详情
AI辅助视频编辑工作流
video-editing
affaan-m/everything-claude-code
65
这是一个完整的、多阶段的AI辅助视频编辑工作流。它覆盖了从原始素材采集、AI结构化规划,到确定性剪辑、程序化合成、AI素材生成,以及最终的人工润色等所有环节。适用于Vlog、教程或企业视频的构建。
查看详情
自主AI研究编排引擎
autoresearch
Orchestra-Research/AI-Research-SKILLs
368
该技能利用两循环架构,编排端到端的自主人工智能研究项目。它负责管理整个研究生命周期,从文献综述、假设形成、运行受限实验,到将发现综合成可发表的论文。它充当项目经理,能自主驱动整个流程,并结构化工作空间,定期向用户汇报进度。
查看详情
AI幻灯片生成器
ppt-generation
bytedance/deer-flow
435
通过规划幻灯片结构、为每页生成 AI 图像,并将它们组合成风格统一的 PPTX 演示文稿,快速产出高质量的演示材料。
查看详情
AI图像生成与编辑工具
nano-banana-pro-openrouter
github/awesome-copilot
435
该工具利用OpenRouter和Gemini 3 Pro Image模型,提供强大的图像创作能力。支持纯文本提示生成、对现有图像进行精细编辑,以及多图元素合成。用户可自定义分辨率(最高4K),适用于专业设计和创意工作流,实现从概念到高质量图像的完整流程。
查看详情
深度伪造检测与媒体溯源
resemble-detect
Prat011/awesome-llm-skills
235
该技能提供全面的媒体情报分析能力,用于检测音频、图像、视频和文本中的合成操纵和AI生成内容。它可以进行深度伪造检测、追踪内容原始生成来源、应用与检测水印,并验证说话人身份,确保媒体的真实性和可信度。
查看详情
高级音频处理与语音合成
elevenlabs-core-workflow-b
jeremylongshore/claude-code-plugins-plus-skills
232
本工作流提供了一套全面的专业音频处理解决方案。它集成了语音到语音转换(变声器)、文本生成音效、音频降噪隔离和语音转文字转录等多个高级功能。适用于内容创作、播客制作、音频编辑等需要高质量声音处理的场景。
查看详情
ElevenLabs成本优化与配额监控
elevenlabs-cost-tuning
jeremylongshore/claude-code-plugins-plus-skills
446
本技能旨在帮助用户优化 ElevenLabs 语音合成(TTS)的运行成本。它提供了一套完整的流程,包括基于成本的模型选择、通过优化文本内容来减少计费字符数,以及实现实时的配额使用监控和预算预警。适用于构建高并发、对成本敏感的语音应用。
查看详情
1
2
下一页
语言
简体中文
English