下载

Skill UI

浏览并发现 9908+ 精选技能

全部编程开发人工智能设计创意产品商业数据科学市场营销职场通用效率工具硬件工程语言学习

搜索视觉训练，共找到 7 条记录

默认排序最新上传最多下载

BLIP-2 视觉语言框架

blip-2-vision-language

Orchestra-Research/AI-Research-SKILLs

该框架将冻结的图像编码器与大语言模型连接，适用于图像描述、视觉问答、检索与多模态对话，在无需微调的条件下实现零样本推理，并仅训练轻量 Q-Former。

CLIP 视觉语言工具

Orchestra-Research/AI-Research-SKILLs

CLIP 借助预训练对比模型，在零样本图像分类、语义匹配、图像搜索和内容审核等视觉语言场景中无需微调即可部署。

计算机视觉生产级工程技能

senior-computer-vision

alirezarezvani/claude-skills

涵盖了从基础模型到生产部署的完整计算机视觉AI全流程技能。掌握目标检测（YOLO、Faster R-CNN）、实例/语义分割（Mask R-CNN、SAM）等核心技术，并熟练运用PyTorch进行模型训练，最终通过ONNX和TensorRT等工具优化模型，实现边缘或云端设备的稳定部署。

预训练Transformer模型

K-Dense-AI/claude-scientific-skills

用于处理NLP、计算机视觉、音频等多个领域的预训练Transformer模型。支持文本生成、分类、问答、摘要提取、图像检测等复杂任务，并提供模型微调和部署的完整流程，适用于构建专业级的AI应用。

HuggingFace 视觉模型训炼

hugging-face-vision-trainer

sickn33/antigravity-awesome-skills

通过 Hugging Face Jobs 在托管 GPU 上微调或训练目标检测、图像分类与 SAM/SAM2 分割模型，自动验证数据集并将成果保存到 Hugging Face Hub，无需本地 GPU。

转换器库：AI模型开发与微调

K-Dense-AI/scientific-agent-skills

这是一个用于访问和使用海量预训练AI模型的工具库。它支持自然语言处理、计算机视觉、音频处理等多种任务。用户可以使用Pipeline进行快速推理，或使用Trainer API对模型进行专业微调，适用于构建完整的AI应用。

YOLO模型微调与部署

SharpAI/DeepCamera

该技能提供了一个完整的计算机视觉模型生命周期管理工具，支持从自定义数据集标注到模型部署的全流程。用户可以在该平台上使用Agent驱动的工作流，在自定义的COCO格式数据集上微调YOLO模型。它具备硬件感知训练能力，并能自动将模型导出为TensorRT、CoreML、OpenVINO等优化格式，最后可一键部署为活动的检测技能。

1

语言