登录
下载
Skill UI
浏览并发现
10578+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
音频
,共找到
5
条记录
默认排序
最新上传
最多下载
GPU驱动数据策划
nemo-curator
Orchestra-Research/AI-Research-SKILLs
226
NeMo Curator 依托 GPU 与 RAPIDS,为文本/图像/视频/音频等多模态提供质量筛选、模糊与语义去重、PII/NSFW 处理等步骤,快速清洗大规模训练数据。
查看详情
高级视频媒体处理与分析引擎
videodb
affaan-m/everything-claude-code
110
一个强大的多模态视频媒体处理工具。支持从本地文件、URL、直播流和桌面捕获获取内容。具备高级索引、时间轴编辑、转码、字幕生成、画中画等复杂功能。适用于内容创作、实时监控系统以及任何需要处理和分析视频/音频流的工作流。
查看详情
多格式文件转Markdown
markitdown
K-Dense-AI/scientific-agent-skills
350
MarkItDown是一款强大的文件转换工具,支持PDF、Word、PPT、图片、音频、表格等超过15种格式。它能将复杂的文档内容提取并转换为结构清晰、对大型语言模型(LLM)极度友好的Markdown格式,是实现多源数据内容结构化和AI应用的关键步骤。
查看详情
异步语音转录与智能分析
assemblyai-core-workflow-a
jeremylongshore/claude-code-plugins-plus-skills
447
基于AssemblyAI的综合异步转录工作流,用于处理音频或视频文件。该功能提供强大的音频智能分析能力,包括说话人分离(Diarization)、情感分析、实体识别、内容安全审核、话题分类和敏感个人信息(PII)脱敏。适用于会议记录、访谈和大规模语音内容处理场景。
查看详情
隐写术检测与提取专家指南
steganography-techniques
yaklang/hack-skills
430
本指南为数字取证专家提供了一套系统化的隐写术检测与提取流程。内容涵盖了对图片(LSB、PNG/JPEG结构、EXIF)、音频(频谱图、DTMF)和文件(多语言文件、附加数据)等多种媒体类型中隐藏数据的检测和提取方法,是深入取证分析的必备工具。
查看详情
1
语言
简体中文
English