登录
下载
Skill UI
浏览并发现
9688+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
机器人
,共找到
12
条记录
默认排序
最新上传
最多下载
.NET版Azure OpenAI SDK
azure-ai-openai-dotnet
sickn33/antigravity-awesome-skills
385
这是一个用于.NET环境的Azure OpenAI客户端库。它提供了访问包括GPT-4o、嵌入、DALL-E和Whisper等多种OpenAI模型的接口。开发者可以使用它来构建复杂的聊天机器人、实现结构化JSON输出,或进行RAG(检索增强生成)等高级应用。
查看详情
Azure AI实时语音对话SDK
azure-ai-voicelive-java
sickn33/antigravity-awesome-skills
63
这是一个用于Java开发的SDK,用于实现与Azure AI助手的实时、双向语音对话。它通过WebSocket技术支持低延迟流媒体通信,并集成了高级功能,如语音活动检测、降噪处理和多种AI音色选择。非常适用于构建专业的语音机器人和交互式语音应用。
查看详情
领先计算机视觉架构师
computer-vision-expert
sickn33/antigravity-awesome-skills
285
提供设计、实现和优化前沿计算机视觉流程的专业指导。涵盖实时目标检测(YOLO26)、基于提示的语义分割(SAM 3)以及利用视觉语言模型(VLM)进行高级视觉推理。适用于机器人、自动驾驶和工业检测等场景,尤其擅长3D重建和边缘侧部署优化。
查看详情
LlamaIndex 数据框架
llamaindex
Orchestra-Research/AI-Research-SKILLs
185
LlamaIndex 提供 300+ 数据连接器、向量索引、查询引擎、Agents 和多模态支持,帮助构建面向私有数据的文档问答、知识检索、聊天机器人及 RAG 流水线。
查看详情
LLaVA 视觉语言助手
llava
Orchestra-Research/AI-Research-SKILLs
101
LLaVA 将 CLIP 图像编码与 Vicuna/LLaMA 语言模型结合,提供基于图像的多轮对话、视觉问答、描述生成与指令跟随能力,适用于图像理解和视觉语言机器人。
查看详情
AI助手开发专家
llm-application-dev-ai-assistant
sickn33/antigravity-awesome-skills
85
本技能专为AI助手和聊天机器人开发提供全生命周期的指导。它专注于构建具备自然语言理解、上下文管理和无缝集成的智能对话系统。帮助用户从概念到生产环境,开发出具备实际商业价值的AI应用。
查看详情
推测式解码加速
speculative-decoding
Orchestra-Research/AI-Research-SKILLs
244
通过推测式解码、Medusa 多头和前瞻解码等技术,在有限算力上加速聊天机器人、代码助手等实时任务,达到 1.5-3.6 倍速度提升并保持目标模型质量。
查看详情
OpenClaw 语音呼叫助手
clawring
davepoon/buildwithclaude
375
让 OpenClaw 机器人通过托管语音服务主动拨打电话,用于提醒、汇报、报警等场景,无需 Twilio 或 Webhook,通话中实时转写语音并通过 TTS 回复,操作体验与聊天一致。
查看详情
机器人课题探索全流程
idea-discovery-robot
wanshuiyin/Auto-claude-code-research-in-sleep
236
这是一个专业的机器人想法发现工作流,包含文献调研、新颖性检查和批判性回顾等多个阶段。它帮助用户将一个宽泛的机器人方向,系统性地转化为具备可验证性、可仿真化和明确基准测试的创新项目点子,适用于前沿课题研究和项目孵化。
查看详情
OpenVLA-OFT机器人调优
fine-tuning-openvla-oft
Orchestra-Research/AI-Research-SKILLs
141
指导 OpenVLA-OFT/OFT+ 机器人动作生成的微调与评估流程,涵盖 LoRA、连续动作头、FiLM 条件,连接 LIBERO 与 ALOHA 评测与部署。
查看详情
Claude应用构建架构模式
clade-architecture-variants
jeremylongshore/claude-code-plugins-plus-skills
284
本技能详细介绍了五种基于Claude的应用程序架构模式,包括聊天机器人、RAG检索增强、智能体(Agent)、内容管道和评估机制。它提供了完整的代码示例和决策矩阵,帮助开发者根据项目的需求、成本和复杂度选择最合适的实现方案,实现复杂AI应用构建。
查看详情
ElevenLabs TTS与声音克隆工作流
elevenlabs-core-workflow-a
jeremylongshore/claude-code-plugins-plus-skills
190
本流程实现了基于ElevenLabs的文本转语音(TTS)和声音克隆功能。用户可以利用该流程生成高质量、可控的语音内容,包括高级音色和风格调节。它支持从音频样本进行即时声音克隆,并提供WebSocket流式传输,适用于构建实时聊天机器人、直播或需要低延迟音频的应用场景。
查看详情
1
语言
简体中文
English