登录
下载
Skill UI
浏览并发现
9916+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
文本处理
,共找到
7
条记录
默认排序
最新上传
最多下载
火爬数据处理与知识库构建
firecrawl-data-handling
jeremylongshore/claude-code-plugins-plus-skills
248
这是一个全面的数据管道,用于处理、验证和优化来自Firecrawl爬取的网页内容。它支持Markdown清洗、使用Zod进行结构化数据提取、内容去重和为LLM/RAG系统定制的文本分块(Chunking)。旨在确保爬取的数据是标准化、干净、结构化的,可直接用于构建知识库或进行下游AI应用。
查看详情
GPU驱动数据策划
nemo-curator
Orchestra-Research/AI-Research-SKILLs
226
NeMo Curator 依托 GPU 与 RAPIDS,为文本/图像/视频/音频等多模态提供质量筛选、模糊与语义去重、PII/NSFW 处理等步骤,快速清洗大规模训练数据。
查看详情
结构化文本解析:正则与LLM决策框架
regex-vs-llm-structured-text
affaan-m/everything-claude-code
51
这是一个实用的决策框架,指导用户在结构化文本(如表格、试题、发票)解析时,选择使用正则表达式还是大型语言模型(LLM)。核心思路是:利用低成本、确定性的正则匹配处理大部分(95-98%)的常见模式,并引入置信度评分机制,只在遇到低置信度的边界案例时,才调用昂贵的LLM进行二次校验,从而实现成本和精度的最佳平衡。
查看详情
证件图片自动翻译与PDF生成器
visa-doc-translate
affaan-m/everything-claude-code
125
该工具旨在自动化处理各种非英文的签证申请图片文件(如银行流水、在职证明等)。它能自动预处理图片(包括角度校正),采用多重OCR技术提取文本,并将其专业翻译成英文。最终输出的PDF格式专业,包含原始图片和符合认证要求的双语译文,极大地简化了国际签证办理流程。
查看详情
Grammarly文档数据处理管线
grammarly-data-handling
jeremylongshore/claude-code-plugins-plus-skills
334
这是一个用于处理大型文档的完整数据管道,专为与Grammarly API交互设计。它解决了大文件API限制的问题,通过智能文本分块(Chunking)将文本分割为可处理的小块,然后对每一块进行评分,最后汇总所有关键指标(如正确性、清晰度、语气等),生成全面的报告。
查看详情
综合PDF处理与操作指南
document-skills-pdf
aitytech/agentkits-marketing
107
本指南提供了一套完整的PDF处理工具集,涵盖了文本、表格和元数据的提取。用户可以使用Python库(如pypdf, pdfplumber)进行文档合并、拆分、旋转,并利用reportlab创建新的PDF。此外,还结合了命令行工具和OCR流程,支持处理扫描件和复杂的自动化文档流程。
查看详情
本地文档结构化与PDF解析
liteparse
K-Dense-AI/scientific-agent-skills
212
LiteParse是一个快速、开源且本地化的文档解析器,专注于从PDF、图片和Office文件提取具备空间信息的文本。它能输出带边界框(bounding box)的结构化JSON数据,非常适合构建高级RAG系统、知识库构建和复杂数据流水线,无需依赖任何云API,支持OCR和批量处理。
查看详情
1
语言
简体中文
English