登录
下载
Skill UI
浏览并发现
10245+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
爬取
,共找到
67
条记录
默认排序
最新上传
最多下载
Web数据采集与结构化提取
firecrawl-hello-world
jeremylongshore/claude-code-plugins-plus-skills
164
Firecrawl是一个强大的网络数据采集API,用于从网站中获取和处理信息。它支持单页抓取、多页爬取、站点地图生成和利用LLM进行结构化数据提取。适用于构建数据管道、自动化内容监控或进行市场数据分析。
查看详情
Firecrawl事件响应手册
firecrawl-incident-runbook
jeremylongshore/claude-code-plugins-plus-skills
324
本手册是Firecrawl API的综合应急响应指南。它详细指导工程师如何处理API服务中断、凭证过期、速率限制或爬取失败等各类故障。内容涵盖了从快速故障排除(Triage)到事件复盘(Postmortem)的完整流程,旨在确保系统能够快速稳定地恢复正常运行。
查看详情
Firecrawl陷阱与最佳实践指南
firecrawl-known-pitfalls
jeremylongshore/claude-code-plugins-plus-skills
494
本指南汇总了使用Firecrawl进行网络爬取和内容提取时常见的误区和反模式。它提供了一个实用的代码审查清单,帮助开发者避免无限爬取、格式缺失、过度轮询等陷阱,确保数据管道的稳定性和高效性。
查看详情
网络爬虫负载测试与扩容
firecrawl-load-scale
jeremylongshore/claude-code-plugins-plus-skills
425
该技能用于对Firecrawl抓取流程进行全面的负载测试和性能扩展。它通过实现并发控制、批处理和队列管理,帮助用户在遵循API限流的前提下,最大化爬取吞吐量。适用于进行容量规划、进行大规模数据抓取效率优化等专业场景。
查看详情
Firecrawl 本地开发环境搭建
firecrawl-local-dev-loop
jeremylongshore/claude-code-plugins-plus-skills
359
本指南提供了Firecrawl集成项目的完整本地开发环境设置方案。它通过自托管Docker容器运行Firecrawl,无需消耗API点数。支持使用Mock SDK进行单元测试,并连接到本地实例进行完整集成测试,确保开发流程顺畅高效,适用于任何需要爬取和提取网页数据的项目。
查看详情
爬虫迁移:从 Puppeteer 到 Firecrawl
firecrawl-migration-deep-dive
jeremylongshore/claude-code-plugins-plus-skills
155
本指南提供了一个完整的框架,用于将传统的、依赖浏览器或CSS选择器的爬虫代码(如Puppeteer, Playwright)迁移到Firecrawl API。它展示了如何简化爬取流程,实现单页抓取、使用LLM进行结构化数据提取,以及复杂的全站爬取,从而彻底摆脱复杂的浏览器管理和反爬虫机制。
查看详情
多环境爬虫爬取配置指南
firecrawl-multi-env-setup
jeremylongshore/claude-code-plugins-plus-skills
414
本技能指导用户如何为Firecrawl配置可靠的多环境(开发、预发布、生产)爬取流程。核心目标是解决跨环境的配置和成本控制问题。内容涵盖了使用Docker进行本地自托管、环境隔离配置,以及构建安全的爬取封装层,确保数据抓取流程的稳定性和成本可控性。
查看详情
网页抓取管道可观测性
firecrawl-observability
jeremylongshore/claude-code-plugins-plus-skills
260
本技能提供了Firecrawl网络爬取操作的全面可观测性模式。它覆盖了抓取成功率、积分消耗追踪、内容质量评估和延迟监控等关键指标。适用于构建健壮的监控仪表盘、设置主动故障警报,确保爬取工作流的稳定与高效。
查看详情
Firecrawl抓取性能优化指南
firecrawl-performance-tuning
jeremylongshore/claude-code-plugins-plus-skills
272
本指南深入介绍了优化Firecrawl爬取性能的高级技巧,旨在提升爬取效率并降低API成本。核心内容包括:选择最精简的输出格式(如Markdown)、实现URL缓存、使用批量处理(Batch Scrape)和针对动态SPA页面调整等待时间。掌握这些方法,能帮助构建稳定、高效的高吞吐量爬取管道。
查看详情
网络爬虫策略与合规防护
firecrawl-policy-guardrails
jeremylongshore/claude-code-plugins-plus-skills
251
这是一个用于Web爬虫管道的自动化策略防护系统。它能强制执行复杂的爬取规则,包括禁止爬取的域列表、API配额预算控制、内容质量检测(过滤错误页面、内容过少等)以及按域名限速。确保爬取过程合法合规,系统运行稳定,并优化资源消耗。
查看详情
Firecrawl生产环境部署清单
firecrawl-prod-checklist
jeremylongshore/claude-code-plugins-plus-skills
174
这是一份全面的清单,用于指导将使用Firecrawl核心API(抓取、爬取等)的应用安全部署到生产环境。内容涵盖了安全凭证管理、爬取安全限制、鲁棒的错误处理机制、监控告警设置以及系统回滚流程,确保部署的可靠性和稳定性。
查看详情
Firecrawl速率限制与重试优化
firecrawl-rate-limits
jeremylongshore/claude-code-plugins-plus-skills
124
这是一个关于处理外部API限速(如429错误)的进阶指南。它展示了如何使用指数退避、随机抖动、以及p-queue队列管理等高级技术,实现健壮可靠的API调用流程,确保在进行大规模爬取任务时,程序稳定高效,不会因速率限制而中断。
查看详情
上一页
1
2
3
4
5
6
下一页
语言
简体中文
English