登录
下载
Skill UI
浏览并发现
7268+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
文本生成图像
,共找到
10
条记录
默认排序
最新上传
最多下载
Azure AI图像分析Java开发工具包
azure-ai-vision-imageanalysis-java
sickn33/antigravity-awesome-skills
265
本SDK为Java开发者提供了访问Azure AI Vision高级图像分析功能的能力。它允许应用程序执行多种视觉任务,包括OCR文本提取、生成图像描述、检测带边界框的物体、识别内容标签以及智能裁剪。适用于需要对图像内容进行深度理解和结构化数据提取的场景。
查看详情
OpenAI 自动化工具
openai-automation
ComposioHQ/awesome-claude-skills
91
通过 Composio MCP 集成自动化 OpenAI API 操作,涵盖文本/多模态响应、结构化输出、嵌入向量、图像生成与模型查看等常见流程。
查看详情
句向量嵌入框架
sentence-transformers
Orchestra-Research/AI-Research-SKILLs
433
Sentence Transformers 提供 5000+ 预训练模型,可生成句、文本与图像嵌入,支持 RAG、语义搜索、聚类、多语言与多模态,适合本地生产环境使用。
查看详情
稳定扩散图像生成指南
stable-diffusion-image-generation
Orchestra-Research/AI-Research-SKILLs
373
本指南全面介绍了如何使用HuggingFace Diffusers库和Stable Diffusion模型进行高级图像生成。用户可以实现从文本描述生成图像(Text-to-Image)、图像到图像的风格迁移、局部重绘(Inpainting)以及图像扩展等功能。适用于需要高性能、高保真度和可定制化工作流的创意或计算机视觉应用场景。
查看详情
推理驱动图像简报
muapi-nano-banana
SamurAIGPT/Generative-Media-Skills
457
该技能将用户意图转化为Gemini 3风格的结构化创意简报,通过muapi.ai生成具备物理逻辑、光照和文本精度的高保真图像。
查看详情
预训练Transformer模型
transformers
K-Dense-AI/claude-scientific-skills
151
用于处理NLP、计算机视觉、音频等多个领域的预训练Transformer模型。支持文本生成、分类、问答、摘要提取、图像检测等复杂任务,并提供模型微调和部署的完整流程,适用于构建专业级的AI应用。
查看详情
fal.ai 媒体生成
fal-ai-media
affaan-m/everything-claude-code
475
通过 fal.ai MCP 一站式访问 Nano Banana、Seedance、Kling、Veo 3、CSM-1B 和 ThinkSound 等模型,完成文本/图像到图像、视频和音频的生成与编辑,适合快速迭代与生产级创意媒体制作。
查看详情
AI图像生成与编辑工具
nano-banana-pro-openrouter
github/awesome-copilot
190
该工具利用OpenRouter和Gemini 3 Pro Image模型,提供强大的图像创作能力。支持纯文本提示生成、对现有图像进行精细编辑,以及多图元素合成。用户可自定义分辨率(最高4K),适用于专业设计和创意工作流,实现从概念到高质量图像的完整流程。
查看详情
深度伪造检测与媒体溯源
resemble-detect
Prat011/awesome-llm-skills
94
该技能提供全面的媒体情报分析能力,用于检测音频、图像、视频和文本中的合成操纵和AI生成内容。它可以进行深度伪造检测、追踪内容原始生成来源、应用与检测水印,并验证说话人身份,确保媒体的真实性和可信度。
查看详情
预训练Transformer模型
transformers
K-Dense-AI/scientific-agent-skills
188
用于处理NLP、计算机视觉、音频等多个领域的预训练Transformer模型。支持文本生成、分类、问答、摘要提取、图像检测等复杂任务,并提供模型微调和部署的完整流程,适用于构建专业级的AI应用。
查看详情
1
语言
简体中文
English