下载

Skill UI

浏览并发现 7268+ 精选技能

全部编程开发人工智能设计创意产品商业数据科学市场营销职场通用效率工具硬件工程语言学习

搜索文本生成图像，共找到 10 条记录

默认排序最新上传最多下载

Azure AI图像分析Java开发工具包

azure-ai-vision-imageanalysis-java

sickn33/antigravity-awesome-skills

本SDK为Java开发者提供了访问Azure AI Vision高级图像分析功能的能力。它允许应用程序执行多种视觉任务，包括OCR文本提取、生成图像描述、检测带边界框的物体、识别内容标签以及智能裁剪。适用于需要对图像内容进行深度理解和结构化数据提取的场景。

OpenAI 自动化工具

openai-automation

ComposioHQ/awesome-claude-skills

通过 Composio MCP 集成自动化 OpenAI API 操作，涵盖文本/多模态响应、结构化输出、嵌入向量、图像生成与模型查看等常见流程。

句向量嵌入框架

sentence-transformers

Orchestra-Research/AI-Research-SKILLs

Sentence Transformers 提供 5000+ 预训练模型，可生成句、文本与图像嵌入，支持 RAG、语义搜索、聚类、多语言与多模态，适合本地生产环境使用。

稳定扩散图像生成指南

stable-diffusion-image-generation

Orchestra-Research/AI-Research-SKILLs

本指南全面介绍了如何使用HuggingFace Diffusers库和Stable Diffusion模型进行高级图像生成。用户可以实现从文本描述生成图像（Text-to-Image）、图像到图像的风格迁移、局部重绘（Inpainting）以及图像扩展等功能。适用于需要高性能、高保真度和可定制化工作流的创意或计算机视觉应用场景。

推理驱动图像简报

muapi-nano-banana

SamurAIGPT/Generative-Media-Skills

该技能将用户意图转化为Gemini 3风格的结构化创意简报，通过muapi.ai生成具备物理逻辑、光照和文本精度的高保真图像。

预训练Transformer模型

K-Dense-AI/claude-scientific-skills

用于处理NLP、计算机视觉、音频等多个领域的预训练Transformer模型。支持文本生成、分类、问答、摘要提取、图像检测等复杂任务，并提供模型微调和部署的完整流程，适用于构建专业级的AI应用。

fal.ai 媒体生成

affaan-m/everything-claude-code

通过 fal.ai MCP 一站式访问 Nano Banana、Seedance、Kling、Veo 3、CSM-1B 和 ThinkSound 等模型，完成文本/图像到图像、视频和音频的生成与编辑，适合快速迭代与生产级创意媒体制作。

AI图像生成与编辑工具

nano-banana-pro-openrouter

github/awesome-copilot

该工具利用OpenRouter和Gemini 3 Pro Image模型，提供强大的图像创作能力。支持纯文本提示生成、对现有图像进行精细编辑，以及多图元素合成。用户可自定义分辨率（最高4K），适用于专业设计和创意工作流，实现从概念到高质量图像的完整流程。

深度伪造检测与媒体溯源

resemble-detect

Prat011/awesome-llm-skills

该技能提供全面的媒体情报分析能力，用于检测音频、图像、视频和文本中的合成操纵和AI生成内容。它可以进行深度伪造检测、追踪内容原始生成来源、应用与检测水印，并验证说话人身份，确保媒体的真实性和可信度。

预训练Transformer模型

K-Dense-AI/scientific-agent-skills

用于处理NLP、计算机视觉、音频等多个领域的预训练Transformer模型。支持文本生成、分类、问答、摘要提取、图像检测等复杂任务，并提供模型微调和部署的完整流程，适用于构建专业级的AI应用。

1

语言