登录
下载
Skill UI
浏览并发现
10585+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
OCR
,共找到
6
条记录
默认排序
最新上传
最多下载
证件图片自动翻译与PDF生成器
visa-doc-translate
affaan-m/everything-claude-code
125
该工具旨在自动化处理各种非英文的签证申请图片文件(如银行流水、在职证明等)。它能自动预处理图片(包括角度校正),采用多重OCR技术提取文本,并将其专业翻译成英文。最终输出的PDF格式专业,包含原始图片和符合认证要求的双语译文,极大地简化了国际签证办理流程。
查看详情
多格式文件转Markdown
markitdown
K-Dense-AI/scientific-agent-skills
350
MarkItDown是一款强大的文件转换工具,支持PDF、Word、PPT、图片、音频、表格等超过15种格式。它能将复杂的文档内容提取并转换为结构清晰、对大型语言模型(LLM)极度友好的Markdown格式,是实现多源数据内容结构化和AI应用的关键步骤。
查看详情
综合PDF处理与操作指南
document-skills-pdf
aitytech/agentkits-marketing
107
本指南提供了一套完整的PDF处理工具集,涵盖了文本、表格和元数据的提取。用户可以使用Python库(如pypdf, pdfplumber)进行文档合并、拆分、旋转,并利用reportlab创建新的PDF。此外,还结合了命令行工具和OCR流程,支持处理扫描件和复杂的自动化文档流程。
查看详情
通用深度学术研究助手
deep-research
Imbad0202/academic-research-skills
426
这是一个由13个智能体组成的通用、全流程学术研究代理系统。它覆盖了整个研究生命周期,包括:从提炼核心问题、设计研究方法,到进行系统文献回顾、元分析、事实查核和偏倚评估。最终能够生成符合APA 7.0标准的完整报告,是学术研究者、学生等深度研究需求的专业工具。
查看详情
本地版式感知文档解析器
liteparse
K-Dense-AI/scientific-agent-skills
259
LiteParse是一款本地部署、高性能的文档解析工具。它能够从PDF、Office文件和图像中提取布局感知的文本,并输出带有精确坐标(bounding boxes)的结构化JSON数据。适用于构建高级RAG系统、进行引文溯源或作为多模态代理的底层数据预处理。
查看详情
视频OCR内容提取工具
video-content-extractor
sickn33/antigravity-awesome-skills
65
该工具能够自动从MP4视频中提取关键帧,并对这些帧运行OCR文字识别。它最终生成一份结构化的Markdown报告,其中包含完整的视频元数据和带有准确时间戳的文本转录记录。适用于分析讲座、演示文稿或屏幕录像等视频内容。
查看详情
1
语言
简体中文
English