登录
下载
Skill UI
浏览并发现
9952+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
数据爬取
,共找到
28
条记录
默认排序
最新上传
最多下载
Firecrawl架构模式与设计
firecrawl-architecture-variants
jeremylongshore/claude-code-plugins-plus-skills
417
本指南详细介绍了Firecrawl的三种核心架构模式:按需爬取、定时爬取和实时数据管道。帮助用户根据项目的数据量、延迟要求和业务复杂度,选择最合适的爬虫架构。适用于构建高可扩展、生产级的爬虫基础设施,支持知识库和RAG系统构建。
查看详情
Firecrawl 网页自动采集
firecrawl-automation
ComposioHQ/awesome-claude-skills
161
通过 Composio Firecrawl 集成,可在 Claude Code 中直接爬取页面、批量采集链接、提取结构化数据并监控抓取任务,适合终端驱动的 Web 数据流工作。
查看详情
Firecrawl CI/CD 自动化测试配置
firecrawl-ci-integration
jeremylongshore/claude-code-plugins-plus-skills
274
本指南指导用户配置 Firecrawl 的 CI/CD 集成。它涵盖了使用 GitHub Actions设置自动化测试流程,包括API密钥管理、单元测试和实时的集成测试。用于确保网页爬取功能在每一次代码修改或合并时都能自动验证,保证数据提取的准确性和系统稳定性。
查看详情
Firecrawl陷阱与最佳实践指南
firecrawl-known-pitfalls
jeremylongshore/claude-code-plugins-plus-skills
494
本指南汇总了使用Firecrawl进行网络爬取和内容提取时常见的误区和反模式。它提供了一个实用的代码审查清单,帮助开发者避免无限爬取、格式缺失、过度轮询等陷阱,确保数据管道的稳定性和高效性。
查看详情
网络爬虫负载测试与扩容
firecrawl-load-scale
jeremylongshore/claude-code-plugins-plus-skills
425
该技能用于对Firecrawl抓取流程进行全面的负载测试和性能扩展。它通过实现并发控制、批处理和队列管理,帮助用户在遵循API限流的前提下,最大化爬取吞吐量。适用于进行容量规划、进行大规模数据抓取效率优化等专业场景。
查看详情
Firecrawl 本地开发环境搭建
firecrawl-local-dev-loop
jeremylongshore/claude-code-plugins-plus-skills
359
本指南提供了Firecrawl集成项目的完整本地开发环境设置方案。它通过自托管Docker容器运行Firecrawl,无需消耗API点数。支持使用Mock SDK进行单元测试,并连接到本地实例进行完整集成测试,确保开发流程顺畅高效,适用于任何需要爬取和提取网页数据的项目。
查看详情
爬虫迁移:从 Puppeteer 到 Firecrawl
firecrawl-migration-deep-dive
jeremylongshore/claude-code-plugins-plus-skills
155
本指南提供了一个完整的框架,用于将传统的、依赖浏览器或CSS选择器的爬虫代码(如Puppeteer, Playwright)迁移到Firecrawl API。它展示了如何简化爬取流程,实现单页抓取、使用LLM进行结构化数据提取,以及复杂的全站爬取,从而彻底摆脱复杂的浏览器管理和反爬虫机制。
查看详情
多环境爬虫爬取配置指南
firecrawl-multi-env-setup
jeremylongshore/claude-code-plugins-plus-skills
414
本技能指导用户如何为Firecrawl配置可靠的多环境(开发、预发布、生产)爬取流程。核心目标是解决跨环境的配置和成本控制问题。内容涵盖了使用Docker进行本地自托管、环境隔离配置,以及构建安全的爬取封装层,确保数据抓取流程的稳定性和成本可控性。
查看详情
爬虫可靠性和容错设计
firecrawl-reliability-patterns
jeremylongshore/claude-code-plugins-plus-skills
287
本技能集提供了在生产环境中构建稳定、高可靠性爬虫管道的模式。涵盖了电路断路器、内容验证、爬取回退机制和指数退避等高级设计,旨在解决爬取超时、内容缺失或API调用失败等常见问题,确保数据提取的连续性和完整性。
查看详情
深度网页抓取与内容提取
firecrawl-scraper
sickn33/antigravity-awesome-skills
279
使用Firecrawl API进行深度网页抓取,支持内容提取、截图捕获和PDF解析。它能处理复杂的页面交互(如点击和滚动),适用于需要从网页获取结构化、深度信息,或进行批量数据爬取的高级数据分析场景。
查看详情
Firecrawl安全最佳实践
firecrawl-security-basics
jeremylongshore/claude-code-plugins-plus-skills
419
本指南详细介绍了集成Firecrawl时的安全最佳实践。内容涵盖了关键的API密钥管理(使用环境变量,避免硬编码)、使用HMAC-SHA256验证Webhook签名以确保数据完整性、跨环境密钥分离,以及对爬取内容的净化处理,用于防御XSS和PII泄露。适用于构建高安全性的生产系统。
查看详情
Apify 演员开发与部署指南
apify-actor-development
sickn33/antigravity-awesome-skills
442
本指南详细介绍了Apify Actors的开发和部署流程。学习如何创建、修改和部署无服务器应用(Actors),用于执行网络爬取、数据处理和自动化任务。内容涵盖了CLI环境配置、开发工作流全流程以及数据安全和代码最佳实践。
查看详情
1
2
3
下一页
语言
简体中文
English