登录
下载
Skill UI
浏览并发现
10029+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
视觉问答
,共找到
4
条记录
默认排序
最新上传
最多下载
BLIP-2 视觉语言框架
blip-2-vision-language
Orchestra-Research/AI-Research-SKILLs
239
该框架将冻结的图像编码器与大语言模型连接,适用于图像描述、视觉问答、检索与多模态对话,在无需微调的条件下实现零样本推理,并仅训练轻量 Q-Former。
查看详情
LLaVA 视觉语言助手
llava
Orchestra-Research/AI-Research-SKILLs
101
LLaVA 将 CLIP 图像编码与 Vicuna/LLaMA 语言模型结合,提供基于图像的多轮对话、视觉问答、描述生成与指令跟随能力,适用于图像理解和视觉语言机器人。
查看详情
预训练Transformer模型
transformers
K-Dense-AI/claude-scientific-skills
151
用于处理NLP、计算机视觉、音频等多个领域的预训练Transformer模型。支持文本生成、分类、问答、摘要提取、图像检测等复杂任务,并提供模型微调和部署的完整流程,适用于构建专业级的AI应用。
查看详情
AI智能体角色灵魂锻造
openclaw-persona-forge
affaan-m/everything-claude-code
153
本技能是一个完整的AI角色构建流程,用于为智能体(Agent)锻造具有深度、多层次的“灵魂”方案(SOUL.md)。它引导用户定义角色的身份、底线规则、名字和视觉提示词,尤其适用于OpenClaw平台。用户可以通过引导式问答或随机“抽卡”模式,快速生成一套完整、统一且具有高度可信度的角色设定。
查看详情
1
语言
简体中文
English