下载

Skill UI

浏览并发现 9979+ 精选技能

全部编程开发人工智能设计创意产品商业数据科学市场营销职场通用效率工具硬件工程语言学习

搜索视觉化，共找到 14 条记录

默认排序最新上传最多下载

Azure AI图像分析Java开发工具包

azure-ai-vision-imageanalysis-java

sickn33/antigravity-awesome-skills

本SDK为Java开发者提供了访问Azure AI Vision高级图像分析功能的能力。它允许应用程序执行多种视觉任务，包括OCR文本提取、生成图像描述、检测带边界框的物体、识别内容标签以及智能裁剪。适用于需要对图像内容进行深度理解和结构化数据提取的场景。

领先计算机视觉架构师

computer-vision-expert

sickn33/antigravity-awesome-skills

提供设计、实现和优化前沿计算机视觉流程的专业指导。涵盖实时目标检测（YOLO26）、基于提示的语义分割（SAM 3）以及利用视觉语言模型（VLM）进行高级视觉推理。适用于机器人、自动驾驶和工业检测等场景，尤其擅长3D重建和边缘侧部署优化。

AI图像与视频生成

sickn33/antigravity-awesome-skills

利用fal.ai AI模型，本技能可以实现高质量的图像和视频内容生成。适用于所有需要创意视觉素材、进行多媒体内容创作或概念原型设计的场景。核心功能是将文本描述转化为复杂的视觉媒体。

谷歌视觉自动化

google-cloud-vision-automation

ComposioHQ/awesome-claude-skills

通过 Composio Rube MCP 自动查找工具、管理 Google Cloud Vision 连接，并按 schema 规范调度 RUBE_MULTI_EXECUTE_TOOL，以完成自动化视觉任务。

Groq多模态工作流：语音、图像、语音合成

groq-core-workflow-b

jeremylongshore/claude-code-plugins-plus-skills

该工作流是基于Groq的综合多模态解决方案，超越了基础的聊天补全功能。它支持超快速的音频转录（Whisper），利用视觉模型进行图像理解，以及高质量的文本转语音合成。适用于实时内容处理、多媒体分析和自动化内容生成等场景。

计算机视觉生产级工程技能

senior-computer-vision

alirezarezvani/claude-skills

涵盖了从基础模型到生产部署的完整计算机视觉AI全流程技能。掌握目标检测（YOLO、Faster R-CNN）、实例/语义分割（Mask R-CNN、SAM）等核心技术，并熟练运用PyTorch进行模型训练，最终通过ONNX和TensorRT等工具优化模型，实现边缘或云端设备的稳定部署。

稳定扩散图像生成指南

stable-diffusion-image-generation

Orchestra-Research/AI-Research-SKILLs

本指南全面介绍了如何使用HuggingFace Diffusers库和Stable Diffusion模型进行高级图像生成。用户可以实现从文本描述生成图像（Text-to-Image）、图像到图像的风格迁移、局部重绘（Inpainting）以及图像扩展等功能。适用于需要高性能、高保真度和可定制化工作流的创意或计算机视觉应用场景。

结构化视频内容生成器

video-generation

bytedance/deer-flow

该技能用于通过高度结构化的提示词（JSON格式）生成高质量的视频内容。用户可以精确定义视频的场景、角色、运镜、对话和音效等细节，并支持上传参考图像进行视觉指导，从而自动化完成复杂的AI视频生成工作流。

科学图表和示意图生成器

scientific-schematics

K-Dense-AI/scientific-agent-skills

该技能是一款强大的AI工具，专为将复杂的科学概念转化为出版级别的视觉示意图。它使用Nano Banana 2 AI生成，并由Gemini 3.1 Pro Preview进行严格的质量审核。擅长生成神经网络架构图、生物学通路、系统流程图等，并通过智能迭代机制，确保图形质量符合期刊、海报等不同文档类型的标准。

Anthropic消息API进阶模式

clade-model-inference

jeremylongshore/claude-code-plugins-plus-skills

本技能详细介绍了使用Anthropic Messages API的进阶用法。涵盖了实时流式响应处理、系统提示词设置、多模态视觉输入处理以及强制结构化JSON输出等高级功能。适用于构建复杂、健壮、多模态的AI应用场景。

Anthropic核心消息API工作流

clade-core-workflow-a

jeremylongshore/claude-code-plugins-plus-skills

本技能是Anthropic消息API的综合工作流指南，全面涵盖了与Claude模型交互的各种高级功能。包括流式响应、多模态视觉输入、使用系统提示进行结构化JSON输出，以及处理多轮对话等所有最新的API模式，是开发者集成Anthropic模型的首选入口。

家庭助手AI集成桥接

homeassistant-bridge

SharpAI/DeepCamera

该桥接实现了家庭助手（HA）与先进AI系统之间的双向集成。它将HA摄像头实时视频流送入AI进行深度分析（包括目标检测、视觉语言模型和人脸识别）。反之，AI分析得到的物体、描述和人物身份等结果，将回传为HA的实体，从而驱动复杂的自动化场景和智能警报。

语言