登录
下载
Skill UI
浏览并发现
9916+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
数据清洗
,共找到
12
条记录
默认排序
最新上传
最多下载
Clay数据富集陷阱与避坑指南
clay-known-pitfalls
jeremylongshore/claude-code-plugins-plus-skills
398
本文汇总了使用Clay数据富集平台时常见的陷阱、反模式和集成错误。内容涵盖了从Webhook限制到积分浪费、再到数据清洗的多个环节,详细解释了每个陷阱的根源和解决方案,是进行配置审计、新员工培训或提升工作流效率的必备指南。
查看详情
资深数据科学家全栈专家
data-scientist
sickn33/antigravity-awesome-skills
124
本技能模拟的是全栈数据科学家的专业知识,覆盖数据科学的完整流程。它涵盖了从探索性数据分析(EDA)到构建生产级模型部署的全过程。核心能力包括高级统计分析、机器学习(如深度学习、XGBoost)、预测建模,以及利用Python、R、SQL等工具进行数据清洗、分析和可视化,并为商业决策提供实战指导。
查看详情
火爬数据处理与知识库构建
firecrawl-data-handling
jeremylongshore/claude-code-plugins-plus-skills
248
这是一个全面的数据管道,用于处理、验证和优化来自Firecrawl爬取的网页内容。它支持Markdown清洗、使用Zod进行结构化数据提取、内容去重和为LLM/RAG系统定制的文本分块(Chunking)。旨在确保爬取的数据是标准化、干净、结构化的,可直接用于构建知识库或进行下游AI应用。
查看详情
Firecrawl内容爬取与摄取架构
firecrawl-reference-architecture
jeremylongshore/claude-code-plugins-plus-skills
262
本参考架构提供了一套完整的Web内容爬取和摄取流程。它集成了单页抓取、全站爬行、URL映射和结构化数据提取功能。后续的清洗、去重和分块处理,使其非常适合构建企业级的知识库、RAG系统以及复杂的AI数据管道。
查看详情
GPU驱动数据策划
nemo-curator
Orchestra-Research/AI-Research-SKILLs
226
NeMo Curator 依托 GPU 与 RAPIDS,为文本/图像/视频/音频等多模态提供质量筛选、模糊与语义去重、PII/NSFW 处理等步骤,快速清洗大规模训练数据。
查看详情
高级Pandas数据处理专家
pandas-pro
Jeffallan/claude-skills
268
本指南提供使用Pandas进行复杂数据分析、清洗和转换的专家级方法。涵盖向量化操作、高效合并、时间序列重采样、分组聚合和内存优化等高级技巧,旨在确保代码达到生产级质量,并实现严格的数据质量校验。
查看详情
自动化数据预处理
preprocessing-data-with-automated-pipelines
jeremylongshore/claude-code-plugins-plus-skills
335
该技能引导Claude通过自动化数据流水线完成清洗、校验与转换,结合ETL、容错与质量报告,保障数据可供后续分析与建模使用。
查看详情
Pandas数据工具
pandas
sickn33/antigravity-awesome-skills
333
Pandas 是一个 Python 数据分析库,用于快速加载、清洗、转换和分析结构化数据,适合数据整理与分析任务的日常使用。
查看详情
健康数据集成与知识库查询
wellally-tech
sickn33/antigravity-awesome-skills
141
该技能旨在整合多个数字健康数据源(如Apple Health、Fitbit、Oura等)的数据,并将其连接到专业健康知识库。它负责数据导入、格式标准化和清洗,能够根据用户提交的健康数据,提供精准的知识推荐和健康管理建议。
查看详情
信用风险数据清洗管道
datanalysis-credit-risk
github/awesome-copilot
242
面向贷前建模的信用风险数据清洗流程,处理原始数据、异常期、高缺失、低 IV/高 PSI/高相关特征,Null Importance 降噪并导出 Excel 清洗报告,方便质量评估与变量筛选。
查看详情
Navan数据提取与清洗
navan-data-handling
jeremylongshore/claude-code-plugins-plus-skills
446
本技能提供一套完整的Navan数据提取和转换方案,适用于构建数据仓库和分析仪表盘。它涵盖了REST API的复杂处理模式,包括分页获取、日期范围分块和基于UUID的去重清洗等关键步骤。无论是通过直接API接入,还是配置Fivetran/Airbyte等主流数据管道工具,都能帮助用户高效处理和清洗Navan数据。
查看详情
派兰蒂尔基金会最佳实践架构
palantir-reference-architecture
jeremylongshore/claude-code-plugins-plus-skills
199
本指南提供了一套全面的Palantir Foundry参考架构,用于指导构建生产级的企业级数据应用。它详细涵盖了从原始数据摄取、数据清洗、模型构建到最终本体模型(Ontology)的完整数据流转过程,并提供了项目布局、外部API集成和多层安全机制的最佳实践,适用于规划和优化复杂的数据基础设施。
查看详情
1
语言
简体中文
English