下载

Skill UI

浏览并发现 10245+ 精选技能

全部编程开发人工智能设计创意产品商业数据科学市场营销职场通用效率工具硬件工程语言学习

搜索 VR ，共找到 11 条记录

默认排序最新上传最多下载

Azure 实时语音AI开发SDK

azure-ai-voicelive-py

sickn33/antigravity-awesome-skills

该SDK用于构建实时、双向的语音AI应用，通过WebSocket支持实时的语音流媒体通信。它允许开发者将麦克风音频输入模型，并接收合成语音输出。适用于开发智能语音助手、交互式语音系统和呼叫中心解决方案。

Azure呼叫自动化（Java）

azure-communication-callautomation-java

sickn33/antigravity-awesome-skills

该Java SDK用于构建复杂的服务器端呼叫自动化工作流，基于Azure通信服务。它支持实现IVR系统、动态呼叫路由、媒体播放（TTS/音频）、语音识别、DTMF录音、呼叫录制和参与者管理。适用于构建智能客服机器人或自动化通知系统。

Azure呼叫自动化（Java）

azure-communication-callautomation-java

sickn33/antigravity-awesome-skills

该Java SDK用于构建复杂的服务器端呼叫自动化工作流，基于Azure通信服务。它支持实现IVR系统、动态呼叫路由、媒体播放（TTS/音频）、语音识别、DTMF录音、呼叫录制和参与者管理。适用于构建智能客服机器人或自动化通知系统。

实时语音对话智能体开发

sickn33/antigravity-awesome-skills

本技能旨在构建先进的语音AI智能体，实现自然流畅、低延迟的实时人机对话。它深入探讨了两种核心架构：低延迟的语音到语音（S2S）模式和可控的STT→LLM→TTS流水线。核心挑战在于优化端到端延迟（目标小于800ms），处理对话中断、噪音和情感细微差别，适用于客服、IVR和实时翻译等专业场景。

虚拟/增强现实开发原则

sickn33/antigravity-awesome-skills

本技能手册详细介绍了虚拟现实（VR）和增强现实（AR）应用的开发核心原则。内容涵盖了从平台选择、性能指标到用户舒适度的各个方面，包括防止晕动症的技巧、运动追踪的交互设计，以及空间环境的构建要求，是开发沉浸式空间计算应用的重要参考指南。

本地大模型推理与部署专家

local-llm-expert

sickn33/antigravity-awesome-skills

该技能专精于本地大语言模型（LLM）的部署、推理和性能优化。涵盖Ollama、vLLM、llama.cpp等主流推理引擎，以及GGUF、EXL2等主流量化格式。帮助用户在本地硬件上安全、高效地运行先进模型，尤其侧重于隐私保护和离线应用部署。

检测本地二进制文件滥用行为

detecting-living-off-the-land-with-lolbas

mukul975/Anthropic-Cybersecurity-Skills

本技能提供了一套完整的检测生活在土地上（LOLBAS）恶意工具滥用的框架，可识别certutil、regsvr32等系统工具被恶意利用的行为。它结合了Sysmon和Windows事件日志的进程遥测数据、Sigma规则匹配以及父子进程异常分析，适用于安全运营中心（SOC）分析师和威胁猎手，以应对规避传统安全控制的复杂攻击。

Vast.ai GPU资源租用管理

wanshuiyin/Auto-claude-code-research-in-sleep

该技能用于管理、配置和销毁vast.ai上的GPU实例。它能深入分析您的深度学习任务，自动确定精确的硬件需求（如显存、GPU数量、存储空间），并搜索到最具成本效益、高可靠性的GPU资源。从任务分析到实验监控，全程管理GPU生命周期，确保您以最低成本租用到所需资源。

ElevenLabs TTS性能优化指南

elevenlabs-performance-tuning

jeremylongshore/claude-code-plugins-plus-skills

本指南提供了优化ElevenLabs TTS性能的完整技术方案。内容涵盖了如何通过模型选择（如Flash模型）、利用流媒体（Streaming）接口以及优化音频格式，来显著降低语音生成延迟和提高数据吞吐量。适用于实时对话、IVR系统和高并发的语音内容生成场景。

语音克隆实验室：生成可重用音色

voice-clone-lab

opensquilla/opensquilla

该功能提供专业的语音克隆服务，能够从本地音频样本创建并注册可重用的虚拟声音。它严格遵循“先征得同意”的工作流，必须获取发言人身份、使用范围和样本来源的明确同意。适用于需要品牌一致性、高性能TTS、虚拟人内容或专业配音的场景。

专业文字转语音配音工作室

voiceover-studio

opensquilla/opensquilla

这是一个专业的文本转语音（TTS）配音系统，能够将任何书面文本转化为高质量、自然流畅的音频内容。它支持多种应用场景，包括播客旁白、产品解说、IVR提示和短视频配音。系统具备高级功能，可根据用户指定的目标语言、地域口音、情绪和语速进行优化，确保生成的音频在不同文化背景下都自然准确。

1

语言