下载

Skill UI

浏览并发现 9916+ 精选技能

全部编程开发人工智能设计创意产品商业数据科学市场营销职场通用效率工具硬件工程语言学习

搜索数据清洗，共找到 12 条记录

默认排序最新上传最多下载

Clay数据富集陷阱与避坑指南

clay-known-pitfalls

jeremylongshore/claude-code-plugins-plus-skills

本文汇总了使用Clay数据富集平台时常见的陷阱、反模式和集成错误。内容涵盖了从Webhook限制到积分浪费、再到数据清洗的多个环节，详细解释了每个陷阱的根源和解决方案，是进行配置审计、新员工培训或提升工作流效率的必备指南。

资深数据科学家全栈专家

sickn33/antigravity-awesome-skills

本技能模拟的是全栈数据科学家的专业知识，覆盖数据科学的完整流程。它涵盖了从探索性数据分析（EDA）到构建生产级模型部署的全过程。核心能力包括高级统计分析、机器学习（如深度学习、XGBoost）、预测建模，以及利用Python、R、SQL等工具进行数据清洗、分析和可视化，并为商业决策提供实战指导。

火爬数据处理与知识库构建

firecrawl-data-handling

jeremylongshore/claude-code-plugins-plus-skills

这是一个全面的数据管道，用于处理、验证和优化来自Firecrawl爬取的网页内容。它支持Markdown清洗、使用Zod进行结构化数据提取、内容去重和为LLM/RAG系统定制的文本分块（Chunking）。旨在确保爬取的数据是标准化、干净、结构化的，可直接用于构建知识库或进行下游AI应用。

Firecrawl内容爬取与摄取架构

firecrawl-reference-architecture

jeremylongshore/claude-code-plugins-plus-skills

本参考架构提供了一套完整的Web内容爬取和摄取流程。它集成了单页抓取、全站爬行、URL映射和结构化数据提取功能。后续的清洗、去重和分块处理，使其非常适合构建企业级的知识库、RAG系统以及复杂的AI数据管道。

GPU驱动数据策划

Orchestra-Research/AI-Research-SKILLs

NeMo Curator 依托 GPU 与 RAPIDS，为文本/图像/视频/音频等多模态提供质量筛选、模糊与语义去重、PII/NSFW 处理等步骤，快速清洗大规模训练数据。

高级Pandas数据处理专家

Jeffallan/claude-skills

本指南提供使用Pandas进行复杂数据分析、清洗和转换的专家级方法。涵盖向量化操作、高效合并、时间序列重采样、分组聚合和内存优化等高级技巧，旨在确保代码达到生产级质量，并实现严格的数据质量校验。

自动化数据预处理

preprocessing-data-with-automated-pipelines

jeremylongshore/claude-code-plugins-plus-skills

该技能引导Claude通过自动化数据流水线完成清洗、校验与转换，结合ETL、容错与质量报告，保障数据可供后续分析与建模使用。

Pandas数据工具

sickn33/antigravity-awesome-skills

Pandas 是一个 Python 数据分析库，用于快速加载、清洗、转换和分析结构化数据，适合数据整理与分析任务的日常使用。

健康数据集成与知识库查询

sickn33/antigravity-awesome-skills

该技能旨在整合多个数字健康数据源（如Apple Health、Fitbit、Oura等）的数据，并将其连接到专业健康知识库。它负责数据导入、格式标准化和清洗，能够根据用户提交的健康数据，提供精准的知识推荐和健康管理建议。

信用风险数据清洗管道

datanalysis-credit-risk

github/awesome-copilot

面向贷前建模的信用风险数据清洗流程，处理原始数据、异常期、高缺失、低 IV/高 PSI/高相关特征，Null Importance 降噪并导出 Excel 清洗报告，方便质量评估与变量筛选。

Navan数据提取与清洗

navan-data-handling

jeremylongshore/claude-code-plugins-plus-skills

本技能提供一套完整的Navan数据提取和转换方案，适用于构建数据仓库和分析仪表盘。它涵盖了REST API的复杂处理模式，包括分页获取、日期范围分块和基于UUID的去重清洗等关键步骤。无论是通过直接API接入，还是配置Fivetran/Airbyte等主流数据管道工具，都能帮助用户高效处理和清洗Navan数据。

派兰蒂尔基金会最佳实践架构

palantir-reference-architecture

jeremylongshore/claude-code-plugins-plus-skills

本指南提供了一套全面的Palantir Foundry参考架构，用于指导构建生产级的企业级数据应用。它详细涵盖了从原始数据摄取、数据清洗、模型构建到最终本体模型（Ontology）的完整数据流转过程，并提供了项目布局、外部API集成和多层安全机制的最佳实践，适用于规划和优化复杂的数据基础设施。

1

语言