下载

Skill UI

浏览并发现 10029+ 精选技能

全部编程开发人工智能设计创意产品商业数据科学市场营销职场通用效率工具硬件工程语言学习

搜索视觉问答，共找到 4 条记录

默认排序最新上传最多下载

BLIP-2 视觉语言框架

blip-2-vision-language

Orchestra-Research/AI-Research-SKILLs

该框架将冻结的图像编码器与大语言模型连接，适用于图像描述、视觉问答、检索与多模态对话，在无需微调的条件下实现零样本推理，并仅训练轻量 Q-Former。

LLaVA 视觉语言助手

Orchestra-Research/AI-Research-SKILLs

LLaVA 将 CLIP 图像编码与 Vicuna/LLaMA 语言模型结合，提供基于图像的多轮对话、视觉问答、描述生成与指令跟随能力，适用于图像理解和视觉语言机器人。

预训练Transformer模型

K-Dense-AI/claude-scientific-skills

用于处理NLP、计算机视觉、音频等多个领域的预训练Transformer模型。支持文本生成、分类、问答、摘要提取、图像检测等复杂任务，并提供模型微调和部署的完整流程，适用于构建专业级的AI应用。

AI智能体角色灵魂锻造

openclaw-persona-forge

affaan-m/everything-claude-code

本技能是一个完整的AI角色构建流程，用于为智能体（Agent）锻造具有深度、多层次的“灵魂”方案（SOUL.md）。它引导用户定义角色的身份、底线规则、名字和视觉提示词，尤其适用于OpenClaw平台。用户可以通过引导式问答或随机“抽卡”模式，快速生成一套完整、统一且具有高度可信度的角色设定。

1

语言