登录
下载
Skill UI
浏览并发现
5096+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
视觉语言
,共找到
3
条记录
默认排序
最新上传
最多下载
BLIP-2 视觉语言预训练
blip-2-vision-language
Orchestra-Research/AI-Research-SKILLs
375
BLIP-2 将冻结图像编码器与大语言模型连接为视觉语言预训练框架,可用于高质量图像描述、视觉问答、图文检索或零样本多模态对话。
查看详情
CLIP 视觉语言模型
clip
Orchestra-Research/AI-Research-SKILLs
423
OpenAI 的 CLIP 将视觉与语言连接,可实现零样本图像分类、语义搜索、内容审核及跨模态检索,适合集成在需要图文匹配或向量搜索的通用视觉理解场景中。
查看详情
多模态视觉语言助手
llava
Orchestra-Research/AI-Research-SKILLs
197
开源的 LLaVA 将 CLIP 视觉编码器与 Vicuna/LLaMA 模型结合,支持多轮图像对话、视觉问答、图像描述及视觉指令执行,可通过 CLI、API 或 Gradio 界面部署。
查看详情
1
语言
简体中文
English