登录
下载
Skill UI
浏览并发现
9944+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
多模态
,共找到
39
条记录
默认排序
最新上传
最多下载
实时多模态AI智能体构建
daily
sickn33/antigravity-awesome-skills
472
这是一个用于构建生产级、低延迟的实时多模态AI智能体框架。它允许开发者在一个统一的管道中编排复杂的AI流程,无缝处理实时音频、视频和文本数据。核心功能包括集成多种AI服务(如LLM、语音识别、TTS),管理对话上下文,并支持函数调用,适用于构建高级交互式AI应用。
查看详情
Pipecat低延迟语音助手构建教程
pipecat-friday-agent
sickn33/antigravity-awesome-skills
344
本技能提供了一个完整的F.R.I.D.A.Y.(铁人战甲风格)语音助手的构建蓝图。它利用Pipecat框架,构建了一个低延迟的语音管道,流程包括语音识别(STT)、大型语言模型(LLM)和文本转语音(TTS),支持集成Gemini和OpenAI等多个AI服务商,适用于构建实时、多模态的对话系统。
查看详情
高级视频媒体处理与分析引擎
videodb
affaan-m/everything-claude-code
110
一个强大的多模态视频媒体处理工具。支持从本地文件、URL、直播流和桌面捕获获取内容。具备高级索引、时间轴编辑、转码、字幕生成、画中画等复杂功能。适用于内容创作、实时监控系统以及任何需要处理和分析视频/音频流的工作流。
查看详情
综合AI媒体内容生成
fal-ai-media
affaan-m/everything-claude-code
243
该技能提供了一个统一的平台,使用fal.ai模型生成多模态媒体内容。功能覆盖文本到图像(Nano Banana)、文本/图像到视频(Veo、Kling、Seedance)以及文本/视频到音频(CSM-1B、ThinkSound)。适用于所有需要高质量AI生成图片、视频或音效的创意项目。
查看详情
检测邮件中的二维码钓鱼攻击
detecting-qr-code-phishing-with-email-security
mukul975/Anthropic-Cybersecurity-Skills
256
本指南详细介绍了检测和防御二维码钓鱼(Quishing)攻击的高级方法。它阐述了恶意网址如何嵌入图片绕过传统邮件安全过滤器,需要结合多模态AI、OCR和移动威胁防御。适用于安全运营中心和安全团队。
查看详情
Transformers.js JavaScript 机器学习
transformers-js
sickn33/antigravity-awesome-skills
337
在浏览器或 Node.js 中通过 Transformers.js 运行 Hugging Face 模型,涵盖文本、图像与语音任务,提供 Pipeline 抽象、设备选择与量化选项,可在客户端部署多模态推理,无需后端。
查看详情
Flutter应用中的Firebase AI集成
firebase-ai
evanca/flutter-ai-rules
290
本技能详细介绍了如何在Flutter应用中集成Firebase AI(Gemini)功能。内容涵盖项目配置、文本和聊天内容生成、实时流式输出,以及如何处理多模态输入(文本+图像)。同时强调了错误处理、安全认证和数据隐私的最佳实践,帮助开发者构建完整的AI驱动应用。
查看详情
临床深度学习医疗数据管道
pyhealth
K-Dense-AI/scientific-agent-skills
397
PyHealth是一个用于临床和医疗深度学习的模块化Python工具包。它提供了一个标准化的五阶段流程(数据集→任务→模型→训练器→指标),用于处理复杂的、多模态的医疗数据,包括电子病历、生理信号和医学影像。可用于预测死亡率、再入院风险、药物推荐或进行医学编码映射。
查看详情
单细胞组学深度生成模型
scvi-tools
K-Dense-AI/scientific-agent-skills
390
scvi-tools是一个全面的Python框架,利用深度生成模型和变分推断技术,用于分析单细胞数据的多模态组学数据。它特别适用于进行概率性的批次效应校正、多组学数据整合以及带有不确定性的差异表达分析,支持RNA-seq、ATAC-seq和多组学数据。
查看详情
Anthropic消息API进阶模式
clade-model-inference
jeremylongshore/claude-code-plugins-plus-skills
292
本技能详细介绍了使用Anthropic Messages API的进阶用法。涵盖了实时流式响应处理、系统提示词设置、多模态视觉输入处理以及强制结构化JSON输出等高级功能。适用于构建复杂、健壮、多模态的AI应用场景。
查看详情
Anthropic核心消息API工作流
clade-core-workflow-a
jeremylongshore/claude-code-plugins-plus-skills
158
本技能是Anthropic消息API的综合工作流指南,全面涵盖了与Claude模型交互的各种高级功能。包括流式响应、多模态视觉输入、使用系统提示进行结构化JSON输出,以及处理多轮对话等所有最新的API模式,是开发者集成Anthropic模型的首选入口。
查看详情
LangChain内容块:多模态消息处理
langchain-content-blocks
jeremylongshore/claude-code-plugins-plus-skills
326
本技能深入讲解了LangChain 1.0中各种内容块(文本、图像、工具使用、思考、文档引用)的标准处理方法。它解决了不同LLM提供商(如Claude, GPT-4o, Gemini)在处理多模态输入、工具调用迭代和特殊内容块时的格式差异,确保代码的兼容性和稳定性。
查看详情
上一页
1
2
3
4
下一页
语言
简体中文
English