登录
下载
Skill UI
浏览并发现
9979+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
视觉化
,共找到
14
条记录
默认排序
最新上传
最多下载
Azure AI图像分析Java开发工具包
azure-ai-vision-imageanalysis-java
sickn33/antigravity-awesome-skills
265
本SDK为Java开发者提供了访问Azure AI Vision高级图像分析功能的能力。它允许应用程序执行多种视觉任务,包括OCR文本提取、生成图像描述、检测带边界框的物体、识别内容标签以及智能裁剪。适用于需要对图像内容进行深度理解和结构化数据提取的场景。
查看详情
领先计算机视觉架构师
computer-vision-expert
sickn33/antigravity-awesome-skills
285
提供设计、实现和优化前沿计算机视觉流程的专业指导。涵盖实时目标检测(YOLO26)、基于提示的语义分割(SAM 3)以及利用视觉语言模型(VLM)进行高级视觉推理。适用于机器人、自动驾驶和工业检测等场景,尤其擅长3D重建和边缘侧部署优化。
查看详情
AI图像与视频生成
fal-generate
sickn33/antigravity-awesome-skills
398
利用fal.ai AI模型,本技能可以实现高质量的图像和视频内容生成。适用于所有需要创意视觉素材、进行多媒体内容创作或概念原型设计的场景。核心功能是将文本描述转化为复杂的视觉媒体。
查看详情
谷歌视觉自动化
google-cloud-vision-automation
ComposioHQ/awesome-claude-skills
326
通过 Composio Rube MCP 自动查找工具、管理 Google Cloud Vision 连接,并按 schema 规范调度 RUBE_MULTI_EXECUTE_TOOL,以完成自动化视觉任务。
查看详情
Groq多模态工作流:语音、图像、语音合成
groq-core-workflow-b
jeremylongshore/claude-code-plugins-plus-skills
122
该工作流是基于Groq的综合多模态解决方案,超越了基础的聊天补全功能。它支持超快速的音频转录(Whisper),利用视觉模型进行图像理解,以及高质量的文本转语音合成。适用于实时内容处理、多媒体分析和自动化内容生成等场景。
查看详情
计算机视觉生产级工程技能
senior-computer-vision
alirezarezvani/claude-skills
257
涵盖了从基础模型到生产部署的完整计算机视觉AI全流程技能。掌握目标检测(YOLO、Faster R-CNN)、实例/语义分割(Mask R-CNN、SAM)等核心技术,并熟练运用PyTorch进行模型训练,最终通过ONNX和TensorRT等工具优化模型,实现边缘或云端设备的稳定部署。
查看详情
稳定扩散图像生成指南
stable-diffusion-image-generation
Orchestra-Research/AI-Research-SKILLs
489
本指南全面介绍了如何使用HuggingFace Diffusers库和Stable Diffusion模型进行高级图像生成。用户可以实现从文本描述生成图像(Text-to-Image)、图像到图像的风格迁移、局部重绘(Inpainting)以及图像扩展等功能。适用于需要高性能、高保真度和可定制化工作流的创意或计算机视觉应用场景。
查看详情
结构化视频内容生成器
video-generation
bytedance/deer-flow
277
该技能用于通过高度结构化的提示词(JSON格式)生成高质量的视频内容。用户可以精确定义视频的场景、角色、运镜、对话和音效等细节,并支持上传参考图像进行视觉指导,从而自动化完成复杂的AI视频生成工作流。
查看详情
科学图表和示意图生成器
scientific-schematics
K-Dense-AI/scientific-agent-skills
91
该技能是一款强大的AI工具,专为将复杂的科学概念转化为出版级别的视觉示意图。它使用Nano Banana 2 AI生成,并由Gemini 3.1 Pro Preview进行严格的质量审核。擅长生成神经网络架构图、生物学通路、系统流程图等,并通过智能迭代机制,确保图形质量符合期刊、海报等不同文档类型的标准。
查看详情
Anthropic消息API进阶模式
clade-model-inference
jeremylongshore/claude-code-plugins-plus-skills
292
本技能详细介绍了使用Anthropic Messages API的进阶用法。涵盖了实时流式响应处理、系统提示词设置、多模态视觉输入处理以及强制结构化JSON输出等高级功能。适用于构建复杂、健壮、多模态的AI应用场景。
查看详情
Anthropic核心消息API工作流
clade-core-workflow-a
jeremylongshore/claude-code-plugins-plus-skills
158
本技能是Anthropic消息API的综合工作流指南,全面涵盖了与Claude模型交互的各种高级功能。包括流式响应、多模态视觉输入、使用系统提示进行结构化JSON输出,以及处理多轮对话等所有最新的API模式,是开发者集成Anthropic模型的首选入口。
查看详情
家庭助手AI集成桥接
homeassistant-bridge
SharpAI/DeepCamera
398
该桥接实现了家庭助手(HA)与先进AI系统之间的双向集成。它将HA摄像头实时视频流送入AI进行深度分析(包括目标检测、视觉语言模型和人脸识别)。反之,AI分析得到的物体、描述和人物身份等结果,将回传为HA的实体,从而驱动复杂的自动化场景和智能警报。
查看详情
1
2
下一页
语言
简体中文
English