Tools
Firecrawl
OpenClaw puede usar Firecrawl de tres maneras:
- como proveedor de
web_search - como herramientas explícitas de plugin:
firecrawl_searchyfirecrawl_scrape - como extractor de reserva para
web_fetch
Es un servicio alojado de extracción/búsqueda que admite elusión de bots y almacenamiento en caché, lo que ayuda con sitios con mucho JS o páginas que bloquean solicitudes HTTP simples.
Instalar plugin
Instala el plugin oficial y luego reinicia Gateway:
openclaw plugins install @openclaw/firecrawl-pluginopenclaw gateway restartweb_fetch sin clave y claves de API
La reserva alojada de Firecrawl para web_fetch, seleccionada explícitamente, admite acceso inicial
sin una clave de API. Agrega FIRECRAWL_API_KEY en el entorno del gateway
o configúralo cuando necesites límites más altos. web_search de Firecrawl y
firecrawl_scrape requieren una clave de API.
Configurar la búsqueda de Firecrawl
{ tools: { web: { search: { provider: "firecrawl", }, }, }, plugins: { entries: { firecrawl: { enabled: true, config: { webSearch: { apiKey: "FIRECRAWL_API_KEY_HERE", baseUrl: "https://api.firecrawl.dev", }, }, }, }, },}Notas:
- Elegir Firecrawl en la incorporación o
openclaw configure --section webhabilita automáticamente el plugin de Firecrawl instalado. web_searchcon Firecrawl admitequeryycount.- Para controles específicos de Firecrawl como
sources,categorieso extracción de resultados, usafirecrawl_search. baseUrlusa de forma predeterminada Firecrawl alojado enhttps://api.firecrawl.dev. Las sustituciones autoalojadas solo se permiten para endpoints privados/internos; HTTP solo se acepta para esos destinos privados.FIRECRAWL_BASE_URLes la reserva de entorno compartida para las URL base de búsqueda y extracción de Firecrawl.
Configurar la reserva de Firecrawl para web_fetch
{ tools: { web: { fetch: { provider: "firecrawl", // explicit selection enables keyless fallback }, }, }, plugins: { entries: { firecrawl: { enabled: true, config: { webFetch: { baseUrl: "https://api.firecrawl.dev", onlyMainContent: true, maxAgeMs: 172800000, timeoutSeconds: 60, }, }, }, }, },}Notas:
- La reserva de Firecrawl para
web_fetch, seleccionada explícitamente, funciona sin una clave de API. Cuando está configurado, OpenClaw envíaplugins.entries.firecrawl.config.webFetch.apiKeyoFIRECRAWL_API_KEYpara límites más altos. - Elegir Firecrawl durante la incorporación o
openclaw configure --section webhabilita el plugin y selecciona Firecrawl paraweb_fetch, salvo que ya haya otro proveedor de obtención configurado. firecrawl_scraperequiere una clave de API.maxAgeMscontrola la antigüedad permitida de los resultados almacenados en caché (ms). El valor predeterminado es 2 días.- La configuración heredada
tools.web.fetch.firecrawl.*se migra automáticamente medianteopenclaw doctor --fix. - Las sustituciones de URL base/extracción de Firecrawl siguen la misma regla alojada/privada que la búsqueda: el tráfico público alojado usa
https://api.firecrawl.dev; las sustituciones autoalojadas deben resolverse a endpoints privados/internos. firecrawl_scraperechaza URL de destino obviamente privadas, de loopback, de metadatos y que no sean HTTP(S) antes de reenviarlas a Firecrawl, de acuerdo con el contrato de seguridad de destino deweb_fetchpara llamadas explícitas de extracción con Firecrawl.
firecrawl_scrape reutiliza la misma configuración y variables de entorno plugins.entries.firecrawl.config.webFetch.*, incluida su clave de API obligatoria.
Firecrawl autoalojado
Configura plugins.entries.firecrawl.config.webSearch.baseUrl,
plugins.entries.firecrawl.config.webFetch.baseUrl o FIRECRAWL_BASE_URL
cuando ejecutes Firecrawl por tu cuenta. OpenClaw acepta http:// solo para destinos de loopback,
red privada, .local, .internal o .localhost. Los hosts personalizados públicos
se rechazan para que las claves de API de Firecrawl no se envíen por accidente a endpoints arbitrarios.
Herramientas del plugin de Firecrawl
firecrawl_search
Usa esto cuando quieras controles de búsqueda específicos de Firecrawl en lugar de web_search genérico.
Parámetros principales:
querycountsourcescategoriesscrapeResultstimeoutSeconds
firecrawl_scrape
Usa esto para páginas con mucho JS o protegidas contra bots donde web_fetch simple es débil.
Parámetros principales:
urlextractModemaxCharsonlyMainContentmaxAgeMsproxystoreInCachetimeoutSeconds
Sigilo / elusión de bots
Firecrawl expone un parámetro de modo proxy para la elusión de bots (basic, stealth o auto).
OpenClaw siempre usa proxy: "auto" junto con storeInCache: true para las solicitudes de Firecrawl.
Si se omite proxy, Firecrawl usa auto de forma predeterminada. auto reintenta con proxies sigilosos si falla un intento básico, lo que puede usar más créditos
que la extracción solo básica.
Cómo web_fetch usa Firecrawl
Orden de extracción de web_fetch:
- Readability (local)
- Firecrawl (cuando se selecciona, o se detecta automáticamente a partir de credenciales configuradas)
- Limpieza básica de HTML (última reserva)
El selector es tools.web.fetch.provider. Si lo omites, OpenClaw
detecta automáticamente el primer proveedor listo de obtención web a partir de las credenciales disponibles.
El plugin oficial de Firecrawl proporciona esa reserva.
Relacionado
- Resumen de Web Search -- todos los proveedores y la detección automática
- Web Fetch -- herramienta
web_fetchcon reserva de Firecrawl - Tavily -- herramientas de búsqueda + extracción