登录
下载
Skill UI
浏览并发现
9746+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
数据爬取
,共找到
45
条记录
默认排序
最新上传
最多下载
AI驱动的市场研究与个性化外联
clay-core-workflow-b
jeremylongshore/claude-code-plugins-plus-skills
374
该工作流利用Claygent AI结合网站爬取和研究能力,从目标公司获取资金轮次、技术栈、痛点等深度数据。随后,它利用这些丰富的数据为外联活动生成高度个性化、自然流畅的邮件开场白,支持大规模、精准的营销活动。
查看详情
Firecrawl架构模式与设计
firecrawl-architecture-variants
jeremylongshore/claude-code-plugins-plus-skills
417
本指南详细介绍了Firecrawl的三种核心架构模式:按需爬取、定时爬取和实时数据管道。帮助用户根据项目的数据量、延迟要求和业务复杂度,选择最合适的爬虫架构。适用于构建高可扩展、生产级的爬虫基础设施,支持知识库和RAG系统构建。
查看详情
Firecrawl 网页自动采集
firecrawl-automation
ComposioHQ/awesome-claude-skills
161
通过 Composio Firecrawl 集成,可在 Claude Code 中直接爬取页面、批量采集链接、提取结构化数据并监控抓取任务,适合终端驱动的 Web 数据流工作。
查看详情
Firecrawl CI/CD 自动化测试配置
firecrawl-ci-integration
jeremylongshore/claude-code-plugins-plus-skills
274
本指南指导用户配置 Firecrawl 的 CI/CD 集成。它涵盖了使用 GitHub Actions设置自动化测试流程,包括API密钥管理、单元测试和实时的集成测试。用于确保网页爬取功能在每一次代码修改或合并时都能自动验证,保证数据提取的准确性和系统稳定性。
查看详情
Firecrawl成本优化指南
firecrawl-cost-tuning
jeremylongshore/claude-code-plugins-plus-skills
200
本技能指南详细介绍了如何在使用 Firecrawl 进行网络爬取时,最大程度地优化 API 成本和信用点消耗。通过设置爬取限制、采用批量抓取、实现本地缓存和预算监控等方法,可以显著降低 API 调用成本,确保数据提取流程既高效又经济。
查看详情
火爬数据处理与知识库构建
firecrawl-data-handling
jeremylongshore/claude-code-plugins-plus-skills
248
这是一个全面的数据管道,用于处理、验证和优化来自Firecrawl爬取的网页内容。它支持Markdown清洗、使用Zod进行结构化数据提取、内容去重和为LLM/RAG系统定制的文本分块(Chunking)。旨在确保爬取的数据是标准化、干净、结构化的,可直接用于构建知识库或进行下游AI应用。
查看详情
Web数据采集与结构化提取
firecrawl-hello-world
jeremylongshore/claude-code-plugins-plus-skills
164
Firecrawl是一个强大的网络数据采集API,用于从网站中获取和处理信息。它支持单页抓取、多页爬取、站点地图生成和利用LLM进行结构化数据提取。适用于构建数据管道、自动化内容监控或进行市场数据分析。
查看详情
Firecrawl陷阱与最佳实践指南
firecrawl-known-pitfalls
jeremylongshore/claude-code-plugins-plus-skills
494
本指南汇总了使用Firecrawl进行网络爬取和内容提取时常见的误区和反模式。它提供了一个实用的代码审查清单,帮助开发者避免无限爬取、格式缺失、过度轮询等陷阱,确保数据管道的稳定性和高效性。
查看详情
网络爬虫负载测试与扩容
firecrawl-load-scale
jeremylongshore/claude-code-plugins-plus-skills
425
该技能用于对Firecrawl抓取流程进行全面的负载测试和性能扩展。它通过实现并发控制、批处理和队列管理,帮助用户在遵循API限流的前提下,最大化爬取吞吐量。适用于进行容量规划、进行大规模数据抓取效率优化等专业场景。
查看详情
Firecrawl 本地开发环境搭建
firecrawl-local-dev-loop
jeremylongshore/claude-code-plugins-plus-skills
359
本指南提供了Firecrawl集成项目的完整本地开发环境设置方案。它通过自托管Docker容器运行Firecrawl,无需消耗API点数。支持使用Mock SDK进行单元测试,并连接到本地实例进行完整集成测试,确保开发流程顺畅高效,适用于任何需要爬取和提取网页数据的项目。
查看详情
爬虫迁移:从 Puppeteer 到 Firecrawl
firecrawl-migration-deep-dive
jeremylongshore/claude-code-plugins-plus-skills
155
本指南提供了一个完整的框架,用于将传统的、依赖浏览器或CSS选择器的爬虫代码(如Puppeteer, Playwright)迁移到Firecrawl API。它展示了如何简化爬取流程,实现单页抓取、使用LLM进行结构化数据提取,以及复杂的全站爬取,从而彻底摆脱复杂的浏览器管理和反爬虫机制。
查看详情
多环境爬虫爬取配置指南
firecrawl-multi-env-setup
jeremylongshore/claude-code-plugins-plus-skills
414
本技能指导用户如何为Firecrawl配置可靠的多环境(开发、预发布、生产)爬取流程。核心目标是解决跨环境的配置和成本控制问题。内容涵盖了使用Docker进行本地自托管、环境隔离配置,以及构建安全的爬取封装层,确保数据抓取流程的稳定性和成本可控性。
查看详情
1
2
3
4
下一页
语言
简体中文
English