登录
下载
Skill UI
浏览并发现
9688+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
爬取
,共找到
13
条记录
默认排序
最新上传
最多下载
网页爬取与内容抓取工作流
firecrawl-core-workflow-a
jeremylongshore/claude-code-plugins-plus-skills
50
本工作流提供核心机制,用于将复杂的实时网站内容转换为干净、结构化的、适用于大型语言模型(LLM)的Markdown格式。它支持单页抓取、深度站点爬取以及大规模异步内容爬取,是构建健壮内容摄取管道的理想方案,能够可靠地从网页中提取结构化信息。
查看详情
火爬数据处理与知识库构建
firecrawl-data-handling
jeremylongshore/claude-code-plugins-plus-skills
248
这是一个全面的数据管道,用于处理、验证和优化来自Firecrawl爬取的网页内容。它支持Markdown清洗、使用Zod进行结构化数据提取、内容去重和为LLM/RAG系统定制的文本分块(Chunking)。旨在确保爬取的数据是标准化、干净、结构化的,可直接用于构建知识库或进行下游AI应用。
查看详情
Web数据采集与结构化提取
firecrawl-hello-world
jeremylongshore/claude-code-plugins-plus-skills
164
Firecrawl是一个强大的网络数据采集API,用于从网站中获取和处理信息。它支持单页抓取、多页爬取、站点地图生成和利用LLM进行结构化数据提取。适用于构建数据管道、自动化内容监控或进行市场数据分析。
查看详情
Firecrawl内容爬取与摄取架构
firecrawl-reference-architecture
jeremylongshore/claude-code-plugins-plus-skills
262
本参考架构提供了一套完整的Web内容爬取和摄取流程。它集成了单页抓取、全站爬行、URL映射和结构化数据提取功能。后续的清洗、去重和分块处理,使其非常适合构建企业级的知识库、RAG系统以及复杂的AI数据管道。
查看详情
Firecrawl网络爬取事件处理指南
firecrawl-webhooks-events
jeremylongshore/claude-code-plugins-plus-skills
185
本指南详细介绍了如何使用Firecrawl Webhook处理异步爬取和批量抓取任务的事件。用户无需通过轮询API来获取状态,而是通过配置Webhook端点,实时接收关键事件(如页面抓取、任务完成等)的推送通知。内容涵盖了事件类型、签名验证机制和实时数据流的处理方法,适用于构建高性能的数据爬取管道。
查看详情
网页搜索与内容提取
tavily-web
sickn33/antigravity-awesome-skills
341
该技能利用Tavily API,提供全面的网络搜索、内容提取和网站爬取能力。适用于需要获取实时信息、从特定URL抓取内容或进行深度网站研究等场景,是强大的信息检索增强工具。
查看详情
X推特数据采集与监控平台
x-twitter-scraper
sickn33/antigravity-awesome-skills
287
本技能提供完整的X(Twitter)数据访问能力。用户可以通过关键词或用户ID搜索推文,获取用户资料和详细的互动指标(点赞、转发)。它支持批量爬取粉丝、关注列表,并具备实时账户监控、设置Webhook以及运行抽奖活动等功能,是一个强大的社交媒体数据分析和情报工具。
查看详情
Apify核心存储与工作流管理
apify-core-workflow-b
jeremylongshore/claude-code-plugins-plus-skills
433
本工具提供对Apify核心存储(数据集、键值存储和请求队列)的全面编程管理能力。它可以执行CRUD操作,实现数据持久化和复杂、多阶段的数据管道编排(例如:爬取→转换→导出)。适用于构建健壮的端到端网络爬取和数据处理自动化工作流。
查看详情
Bright Data爬虫成本优化与管理
brightdata-cost-tuning
jeremylongshore/claude-code-plugins-plus-skills
221
本技能旨在帮助用户优化 Bright Data 的爬取服务成本。提供了详细的成本估算模型、缓存策略和使用量监控代码,指导用户在进行大规模网络数据采集时,选择最合适的产品和最佳的预算管理方案。
查看详情
Bright Data数据采集与爬虫API
brightdata-core-workflow-b
jeremylongshore/claude-code-plugins-plus-skills
284
利用Bright Data的SERP API和Web Scraper API,实现结构化搜索结果和大规模数据的批量采集。支持同步获取主流搜索引擎的JSON数据,并可触发异步爬取任务,适用于市场调研、SEO分析等数据爬取场景。
查看详情
Bright Data 网页数据爬取指南
brightdata-hello-world
jeremylongshore/claude-code-plugins-plus-skills
331
本指南详细介绍了如何使用 Bright Data 的 Web Unlocker 代理进行网页爬取。它展示了如何绕过 CAPTCHA、指纹识别等复杂的反爬机制。内容提供了 Node.js 和 Python 两种语言的代码示例,指导用户通过代理端点或 REST API 实现数据抓取,适用于构建专业的爬虫或数据采集系统。
查看详情
谷歌搜索结构化数据提取
serpapi-core-workflow-a
jeremylongshore/claude-code-plugins-plus-skills
484
该工作流利用SerpApi全面爬取和提取谷歌搜索结果的结构化数据。它能捕捉到有机结果、知识图谱、答案框、相关问题(PAA)和本地商家信息等所有关键组成部分。适用于SEO监测、市场调研、竞品分析或开发需要深度结构化数据洞察的搜索功能。
查看详情
1
2
下一页
语言
简体中文
English