下载

Skill UI

浏览并发现 9688+ 精选技能

全部编程开发人工智能设计创意产品商业数据科学市场营销职场通用效率工具硬件工程语言学习

搜索爬取，共找到 13 条记录

默认排序最新上传最多下载

网页爬取与内容抓取工作流

firecrawl-core-workflow-a

jeremylongshore/claude-code-plugins-plus-skills

本工作流提供核心机制，用于将复杂的实时网站内容转换为干净、结构化的、适用于大型语言模型（LLM）的Markdown格式。它支持单页抓取、深度站点爬取以及大规模异步内容爬取，是构建健壮内容摄取管道的理想方案，能够可靠地从网页中提取结构化信息。

火爬数据处理与知识库构建

firecrawl-data-handling

jeremylongshore/claude-code-plugins-plus-skills

这是一个全面的数据管道，用于处理、验证和优化来自Firecrawl爬取的网页内容。它支持Markdown清洗、使用Zod进行结构化数据提取、内容去重和为LLM/RAG系统定制的文本分块（Chunking）。旨在确保爬取的数据是标准化、干净、结构化的，可直接用于构建知识库或进行下游AI应用。

Web数据采集与结构化提取

firecrawl-hello-world

jeremylongshore/claude-code-plugins-plus-skills

Firecrawl是一个强大的网络数据采集API，用于从网站中获取和处理信息。它支持单页抓取、多页爬取、站点地图生成和利用LLM进行结构化数据提取。适用于构建数据管道、自动化内容监控或进行市场数据分析。

Firecrawl内容爬取与摄取架构

firecrawl-reference-architecture

jeremylongshore/claude-code-plugins-plus-skills

本参考架构提供了一套完整的Web内容爬取和摄取流程。它集成了单页抓取、全站爬行、URL映射和结构化数据提取功能。后续的清洗、去重和分块处理，使其非常适合构建企业级的知识库、RAG系统以及复杂的AI数据管道。

Firecrawl网络爬取事件处理指南

firecrawl-webhooks-events

jeremylongshore/claude-code-plugins-plus-skills

本指南详细介绍了如何使用Firecrawl Webhook处理异步爬取和批量抓取任务的事件。用户无需通过轮询API来获取状态，而是通过配置Webhook端点，实时接收关键事件（如页面抓取、任务完成等）的推送通知。内容涵盖了事件类型、签名验证机制和实时数据流的处理方法，适用于构建高性能的数据爬取管道。

网页搜索与内容提取

sickn33/antigravity-awesome-skills

该技能利用Tavily API，提供全面的网络搜索、内容提取和网站爬取能力。适用于需要获取实时信息、从特定URL抓取内容或进行深度网站研究等场景，是强大的信息检索增强工具。

X推特数据采集与监控平台

x-twitter-scraper

sickn33/antigravity-awesome-skills

本技能提供完整的X（Twitter）数据访问能力。用户可以通过关键词或用户ID搜索推文，获取用户资料和详细的互动指标（点赞、转发）。它支持批量爬取粉丝、关注列表，并具备实时账户监控、设置Webhook以及运行抽奖活动等功能，是一个强大的社交媒体数据分析和情报工具。

Apify核心存储与工作流管理

apify-core-workflow-b

jeremylongshore/claude-code-plugins-plus-skills

本工具提供对Apify核心存储（数据集、键值存储和请求队列）的全面编程管理能力。它可以执行CRUD操作，实现数据持久化和复杂、多阶段的数据管道编排（例如：爬取→转换→导出）。适用于构建健壮的端到端网络爬取和数据处理自动化工作流。

Bright Data爬虫成本优化与管理

brightdata-cost-tuning

jeremylongshore/claude-code-plugins-plus-skills

本技能旨在帮助用户优化 Bright Data 的爬取服务成本。提供了详细的成本估算模型、缓存策略和使用量监控代码，指导用户在进行大规模网络数据采集时，选择最合适的产品和最佳的预算管理方案。

Bright Data数据采集与爬虫API

brightdata-core-workflow-b

jeremylongshore/claude-code-plugins-plus-skills

利用Bright Data的SERP API和Web Scraper API，实现结构化搜索结果和大规模数据的批量采集。支持同步获取主流搜索引擎的JSON数据，并可触发异步爬取任务，适用于市场调研、SEO分析等数据爬取场景。

Bright Data 网页数据爬取指南

brightdata-hello-world

jeremylongshore/claude-code-plugins-plus-skills

本指南详细介绍了如何使用 Bright Data 的 Web Unlocker 代理进行网页爬取。它展示了如何绕过 CAPTCHA、指纹识别等复杂的反爬机制。内容提供了 Node.js 和 Python 两种语言的代码示例，指导用户通过代理端点或 REST API 实现数据抓取，适用于构建专业的爬虫或数据采集系统。

谷歌搜索结构化数据提取

serpapi-core-workflow-a

jeremylongshore/claude-code-plugins-plus-skills

该工作流利用SerpApi全面爬取和提取谷歌搜索结果的结构化数据。它能捕捉到有机结果、知识图谱、答案框、相关问题（PAA）和本地商家信息等所有关键组成部分。适用于SEO监测、市场调研、竞品分析或开发需要深度结构化数据洞察的搜索功能。

语言