登录
下载
Skill UI
浏览并发现
10245+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
VR
,共找到
11
条记录
默认排序
最新上传
最多下载
Azure 实时语音AI开发SDK
azure-ai-voicelive-py
sickn33/antigravity-awesome-skills
105
该SDK用于构建实时、双向的语音AI应用,通过WebSocket支持实时的语音流媒体通信。它允许开发者将麦克风音频输入模型,并接收合成语音输出。适用于开发智能语音助手、交互式语音系统和呼叫中心解决方案。
查看详情
Azure呼叫自动化(Java)
azure-communication-callautomation-java
sickn33/antigravity-awesome-skills
265
该Java SDK用于构建复杂的服务器端呼叫自动化工作流,基于Azure通信服务。它支持实现IVR系统、动态呼叫路由、媒体播放(TTS/音频)、语音识别、DTMF录音、呼叫录制和参与者管理。适用于构建智能客服机器人或自动化通知系统。
查看详情
Azure呼叫自动化(Java)
azure-communication-callautomation-java
sickn33/antigravity-awesome-skills
265
该Java SDK用于构建复杂的服务器端呼叫自动化工作流,基于Azure通信服务。它支持实现IVR系统、动态呼叫路由、媒体播放(TTS/音频)、语音识别、DTMF录音、呼叫录制和参与者管理。适用于构建智能客服机器人或自动化通知系统。
查看详情
实时语音对话智能体开发
voice-agents
sickn33/antigravity-awesome-skills
141
本技能旨在构建先进的语音AI智能体,实现自然流畅、低延迟的实时人机对话。它深入探讨了两种核心架构:低延迟的语音到语音(S2S)模式和可控的STT→LLM→TTS流水线。核心挑战在于优化端到端延迟(目标小于800ms),处理对话中断、噪音和情感细微差别,适用于客服、IVR和实时翻译等专业场景。
查看详情
虚拟/增强现实开发原则
vr-ar
sickn33/antigravity-awesome-skills
187
本技能手册详细介绍了虚拟现实(VR)和增强现实(AR)应用的开发核心原则。内容涵盖了从平台选择、性能指标到用户舒适度的各个方面,包括防止晕动症的技巧、运动追踪的交互设计,以及空间环境的构建要求,是开发沉浸式空间计算应用的重要参考指南。
查看详情
本地大模型推理与部署专家
local-llm-expert
sickn33/antigravity-awesome-skills
484
该技能专精于本地大语言模型(LLM)的部署、推理和性能优化。涵盖Ollama、vLLM、llama.cpp等主流推理引擎,以及GGUF、EXL2等主流量化格式。帮助用户在本地硬件上安全、高效地运行先进模型,尤其侧重于隐私保护和离线应用部署。
查看详情
检测本地二进制文件滥用行为
detecting-living-off-the-land-with-lolbas
mukul975/Anthropic-Cybersecurity-Skills
346
本技能提供了一套完整的检测生活在土地上(LOLBAS)恶意工具滥用的框架,可识别certutil、regsvr32等系统工具被恶意利用的行为。它结合了Sysmon和Windows事件日志的进程遥测数据、Sigma规则匹配以及父子进程异常分析,适用于安全运营中心(SOC)分析师和威胁猎手,以应对规避传统安全控制的复杂攻击。
查看详情
Vast.ai GPU资源租用管理
vast-gpu
wanshuiyin/Auto-claude-code-research-in-sleep
494
该技能用于管理、配置和销毁vast.ai上的GPU实例。它能深入分析您的深度学习任务,自动确定精确的硬件需求(如显存、GPU数量、存储空间),并搜索到最具成本效益、高可靠性的GPU资源。从任务分析到实验监控,全程管理GPU生命周期,确保您以最低成本租用到所需资源。
查看详情
ElevenLabs TTS性能优化指南
elevenlabs-performance-tuning
jeremylongshore/claude-code-plugins-plus-skills
469
本指南提供了优化ElevenLabs TTS性能的完整技术方案。内容涵盖了如何通过模型选择(如Flash模型)、利用流媒体(Streaming)接口以及优化音频格式,来显著降低语音生成延迟和提高数据吞吐量。适用于实时对话、IVR系统和高并发的语音内容生成场景。
查看详情
语音克隆实验室:生成可重用音色
voice-clone-lab
opensquilla/opensquilla
91
该功能提供专业的语音克隆服务,能够从本地音频样本创建并注册可重用的虚拟声音。它严格遵循“先征得同意”的工作流,必须获取发言人身份、使用范围和样本来源的明确同意。适用于需要品牌一致性、高性能TTS、虚拟人内容或专业配音的场景。
查看详情
专业文字转语音配音工作室
voiceover-studio
opensquilla/opensquilla
146
这是一个专业的文本转语音(TTS)配音系统,能够将任何书面文本转化为高质量、自然流畅的音频内容。它支持多种应用场景,包括播客旁白、产品解说、IVR提示和短视频配音。系统具备高级功能,可根据用户指定的目标语言、地域口音、情绪和语速进行优化,确保生成的音频在不同文化背景下都自然准确。
查看详情
1
语言
简体中文
English