下载

Skill UI

浏览并发现 9967+ 精选技能

全部编程开发人工智能设计创意产品商业数据科学市场营销职场通用效率工具硬件工程语言学习

搜索图像对话，共找到 5 条记录

默认排序最新上传最多下载

BLIP-2 视觉语言框架

blip-2-vision-language

Orchestra-Research/AI-Research-SKILLs

该框架将冻结的图像编码器与大语言模型连接，适用于图像描述、视觉问答、检索与多模态对话，在无需微调的条件下实现零样本推理，并仅训练轻量 Q-Former。

LLaVA 视觉语言助手

Orchestra-Research/AI-Research-SKILLs

LLaVA 将 CLIP 图像编码与 Vicuna/LLaMA 语言模型结合，提供基于图像的多轮对话、视觉问答、描述生成与指令跟随能力，适用于图像理解和视觉语言机器人。

Gemini API集成与实践指南

gemini-api-integration

sickn33/antigravity-awesome-skills

本指南提供完整的Gemini API集成教程，涵盖使用Python和Node.js的开发实践。内容包括基础文本生成、多模态输入（文本+图像）、流式响应、函数调用、多轮对话等高级功能。旨在帮助用户掌握Gemini API的生产级应用模式和最佳实践。

结构化视频内容生成器

video-generation

bytedance/deer-flow

该技能用于通过高度结构化的提示词（JSON格式）生成高质量的视频内容。用户可以精确定义视频的场景、角色、运镜、对话和音效等细节，并支持上传参考图像进行视觉指导，从而自动化完成复杂的AI视频生成工作流。

关系感知型每日礼物生成器

sickn33/antigravity-awesome-skills

这是一个关系感知型的日度礼物生成引擎。它采用五阶段创意流程，首先判断当天是否需要赠送礼物，然后根据对话上下文生成核心创意。输出支持H5交互页面、AI图像或视频，确保每次生成的“礼物”都是有意义、不重复且高度个性化的创意产物。

1

语言