登录
下载
Skill UI
浏览并发现
9908+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
视觉训练
,共找到
7
条记录
默认排序
最新上传
最多下载
BLIP-2 视觉语言框架
blip-2-vision-language
Orchestra-Research/AI-Research-SKILLs
239
该框架将冻结的图像编码器与大语言模型连接,适用于图像描述、视觉问答、检索与多模态对话,在无需微调的条件下实现零样本推理,并仅训练轻量 Q-Former。
查看详情
CLIP 视觉语言工具
clip
Orchestra-Research/AI-Research-SKILLs
142
CLIP 借助预训练对比模型,在零样本图像分类、语义匹配、图像搜索和内容审核等视觉语言场景中无需微调即可部署。
查看详情
计算机视觉生产级工程技能
senior-computer-vision
alirezarezvani/claude-skills
257
涵盖了从基础模型到生产部署的完整计算机视觉AI全流程技能。掌握目标检测(YOLO、Faster R-CNN)、实例/语义分割(Mask R-CNN、SAM)等核心技术,并熟练运用PyTorch进行模型训练,最终通过ONNX和TensorRT等工具优化模型,实现边缘或云端设备的稳定部署。
查看详情
预训练Transformer模型
transformers
K-Dense-AI/claude-scientific-skills
151
用于处理NLP、计算机视觉、音频等多个领域的预训练Transformer模型。支持文本生成、分类、问答、摘要提取、图像检测等复杂任务,并提供模型微调和部署的完整流程,适用于构建专业级的AI应用。
查看详情
HuggingFace 视觉模型训炼
hugging-face-vision-trainer
sickn33/antigravity-awesome-skills
264
通过 Hugging Face Jobs 在托管 GPU 上微调或训练目标检测、图像分类与 SAM/SAM2 分割模型,自动验证数据集并将成果保存到 Hugging Face Hub,无需本地 GPU。
查看详情
转换器库:AI模型开发与微调
transformers
K-Dense-AI/scientific-agent-skills
142
这是一个用于访问和使用海量预训练AI模型的工具库。它支持自然语言处理、计算机视觉、音频处理等多种任务。用户可以使用Pipeline进行快速推理,或使用Trainer API对模型进行专业微调,适用于构建完整的AI应用。
查看详情
YOLO模型微调与部署
model-training
SharpAI/DeepCamera
420
该技能提供了一个完整的计算机视觉模型生命周期管理工具,支持从自定义数据集标注到模型部署的全流程。用户可以在该平台上使用Agent驱动的工作流,在自定义的COCO格式数据集上微调YOLO模型。它具备硬件感知训练能力,并能自动将模型导出为TensorRT、CoreML、OpenVINO等优化格式,最后可一键部署为活动的检测技能。
查看详情
1
语言
简体中文
English