登录
下载
Skill UI
浏览并发现
9967+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
图像对话
,共找到
5
条记录
默认排序
最新上传
最多下载
BLIP-2 视觉语言框架
blip-2-vision-language
Orchestra-Research/AI-Research-SKILLs
239
该框架将冻结的图像编码器与大语言模型连接,适用于图像描述、视觉问答、检索与多模态对话,在无需微调的条件下实现零样本推理,并仅训练轻量 Q-Former。
查看详情
LLaVA 视觉语言助手
llava
Orchestra-Research/AI-Research-SKILLs
101
LLaVA 将 CLIP 图像编码与 Vicuna/LLaMA 语言模型结合,提供基于图像的多轮对话、视觉问答、描述生成与指令跟随能力,适用于图像理解和视觉语言机器人。
查看详情
Gemini API集成与实践指南
gemini-api-integration
sickn33/antigravity-awesome-skills
190
本指南提供完整的Gemini API集成教程,涵盖使用Python和Node.js的开发实践。内容包括基础文本生成、多模态输入(文本+图像)、流式响应、函数调用、多轮对话等高级功能。旨在帮助用户掌握Gemini API的生产级应用模式和最佳实践。
查看详情
结构化视频内容生成器
video-generation
bytedance/deer-flow
277
该技能用于通过高度结构化的提示词(JSON格式)生成高质量的视频内容。用户可以精确定义视频的场景、角色、运镜、对话和音效等细节,并支持上传参考图像进行视觉指导,从而自动化完成复杂的AI视频生成工作流。
查看详情
关系感知型每日礼物生成器
daily-gift
sickn33/antigravity-awesome-skills
341
这是一个关系感知型的日度礼物生成引擎。它采用五阶段创意流程,首先判断当天是否需要赠送礼物,然后根据对话上下文生成核心创意。输出支持H5交互页面、AI图像或视频,确保每次生成的“礼物”都是有意义、不重复且高度个性化的创意产物。
查看详情
1
语言
简体中文
English