下载

Skill UI

浏览并发现 9688+ 精选技能

全部编程开发人工智能设计创意产品商业数据科学市场营销职场通用效率工具硬件工程语言学习

搜索机器人，共找到 12 条记录

默认排序最新上传最多下载

.NET版Azure OpenAI SDK

azure-ai-openai-dotnet

sickn33/antigravity-awesome-skills

这是一个用于.NET环境的Azure OpenAI客户端库。它提供了访问包括GPT-4o、嵌入、DALL-E和Whisper等多种OpenAI模型的接口。开发者可以使用它来构建复杂的聊天机器人、实现结构化JSON输出，或进行RAG（检索增强生成）等高级应用。

Azure AI实时语音对话SDK

azure-ai-voicelive-java

sickn33/antigravity-awesome-skills

这是一个用于Java开发的SDK，用于实现与Azure AI助手的实时、双向语音对话。它通过WebSocket技术支持低延迟流媒体通信，并集成了高级功能，如语音活动检测、降噪处理和多种AI音色选择。非常适用于构建专业的语音机器人和交互式语音应用。

领先计算机视觉架构师

computer-vision-expert

sickn33/antigravity-awesome-skills

提供设计、实现和优化前沿计算机视觉流程的专业指导。涵盖实时目标检测（YOLO26）、基于提示的语义分割（SAM 3）以及利用视觉语言模型（VLM）进行高级视觉推理。适用于机器人、自动驾驶和工业检测等场景，尤其擅长3D重建和边缘侧部署优化。

LlamaIndex 数据框架

Orchestra-Research/AI-Research-SKILLs

LlamaIndex 提供 300+ 数据连接器、向量索引、查询引擎、Agents 和多模态支持，帮助构建面向私有数据的文档问答、知识检索、聊天机器人及 RAG 流水线。

LLaVA 视觉语言助手

Orchestra-Research/AI-Research-SKILLs

LLaVA 将 CLIP 图像编码与 Vicuna/LLaMA 语言模型结合，提供基于图像的多轮对话、视觉问答、描述生成与指令跟随能力，适用于图像理解和视觉语言机器人。

AI助手开发专家

llm-application-dev-ai-assistant

sickn33/antigravity-awesome-skills

本技能专为AI助手和聊天机器人开发提供全生命周期的指导。它专注于构建具备自然语言理解、上下文管理和无缝集成的智能对话系统。帮助用户从概念到生产环境，开发出具备实际商业价值的AI应用。

推测式解码加速

speculative-decoding

Orchestra-Research/AI-Research-SKILLs

通过推测式解码、Medusa 多头和前瞻解码等技术，在有限算力上加速聊天机器人、代码助手等实时任务，达到 1.5-3.6 倍速度提升并保持目标模型质量。

OpenClaw 语音呼叫助手

davepoon/buildwithclaude

让 OpenClaw 机器人通过托管语音服务主动拨打电话，用于提醒、汇报、报警等场景，无需 Twilio 或 Webhook，通话中实时转写语音并通过 TTS 回复，操作体验与聊天一致。

机器人课题探索全流程

idea-discovery-robot

wanshuiyin/Auto-claude-code-research-in-sleep

这是一个专业的机器人想法发现工作流，包含文献调研、新颖性检查和批判性回顾等多个阶段。它帮助用户将一个宽泛的机器人方向，系统性地转化为具备可验证性、可仿真化和明确基准测试的创新项目点子，适用于前沿课题研究和项目孵化。

OpenVLA-OFT机器人调优

fine-tuning-openvla-oft

Orchestra-Research/AI-Research-SKILLs

指导 OpenVLA-OFT/OFT+ 机器人动作生成的微调与评估流程，涵盖 LoRA、连续动作头、FiLM 条件，连接 LIBERO 与 ALOHA 评测与部署。

Claude应用构建架构模式

clade-architecture-variants

jeremylongshore/claude-code-plugins-plus-skills

本技能详细介绍了五种基于Claude的应用程序架构模式，包括聊天机器人、RAG检索增强、智能体（Agent）、内容管道和评估机制。它提供了完整的代码示例和决策矩阵，帮助开发者根据项目的需求、成本和复杂度选择最合适的实现方案，实现复杂AI应用构建。

ElevenLabs TTS与声音克隆工作流

elevenlabs-core-workflow-a

jeremylongshore/claude-code-plugins-plus-skills

本流程实现了基于ElevenLabs的文本转语音（TTS）和声音克隆功能。用户可以利用该流程生成高质量、可控的语音内容，包括高级音色和风格调节。它支持从音频样本进行即时声音克隆，并提供WebSocket流式传输，适用于构建实时聊天机器人、直播或需要低延迟音频的应用场景。

1

语言