Tools
Firecrawl
OpenClaw dapat menggunakan Firecrawl dalam tiga cara:
- sebagai penyedia
web_search - sebagai alat Plugin eksplisit:
firecrawl_searchdanfirecrawl_scrape - sebagai ekstraktor fallback untuk
web_fetch
Ini adalah layanan ekstraksi/pencarian terhosting yang mendukung pengelakan bot dan caching, yang membantu untuk situs berat JS atau halaman yang memblokir pengambilan HTTP biasa.
Instal Plugin
Instal Plugin resmi, lalu mulai ulang Gateway:
openclaw plugins install @openclaw/firecrawl-pluginopenclaw gateway restartweb_fetch tanpa kunci dan kunci API
Fallback web_fetch Firecrawl terhosting yang dipilih secara eksplisit mendukung akses
pemula tanpa kunci API. Tambahkan FIRECRAWL_API_KEY di lingkungan gateway
atau konfigurasikan saat Anda membutuhkan batas yang lebih tinggi. Firecrawl web_search dan
firecrawl_scrape memerlukan kunci API.
Konfigurasikan pencarian Firecrawl
{ tools: { web: { search: { provider: "firecrawl", }, }, }, plugins: { entries: { firecrawl: { enabled: true, config: { webSearch: { apiKey: "FIRECRAWL_API_KEY_HERE", baseUrl: "https://api.firecrawl.dev", }, }, }, }, },}Catatan:
- Memilih Firecrawl saat onboarding atau
openclaw configure --section webmengaktifkan Plugin Firecrawl yang terinstal secara otomatis. web_searchdengan Firecrawl mendukungquerydancount.- Untuk kontrol khusus Firecrawl seperti
sources,categories, atau scraping hasil, gunakanfirecrawl_search. baseUrlsecara default mengarah ke Firecrawl terhosting dihttps://api.firecrawl.dev. Override yang di-hosting sendiri hanya diizinkan untuk endpoint privat/internal; HTTP hanya diterima untuk target privat tersebut.FIRECRAWL_BASE_URLadalah fallback env bersama untuk URL dasar pencarian dan scrape Firecrawl.
Konfigurasikan fallback web_fetch Firecrawl
{ tools: { web: { fetch: { provider: "firecrawl", // explicit selection enables keyless fallback }, }, }, plugins: { entries: { firecrawl: { enabled: true, config: { webFetch: { baseUrl: "https://api.firecrawl.dev", onlyMainContent: true, maxAgeMs: 172800000, timeoutSeconds: 60, }, }, }, }, },}Catatan:
- Fallback
web_fetchFirecrawl yang dipilih secara eksplisit berfungsi tanpa kunci API. Saat dikonfigurasi, OpenClaw mengirimplugins.entries.firecrawl.config.webFetch.apiKeyatauFIRECRAWL_API_KEYuntuk batas yang lebih tinggi. - Memilih Firecrawl saat onboarding atau
openclaw configure --section webmengaktifkan Plugin dan memilih Firecrawl untukweb_fetchkecuali penyedia fetch lain sudah dikonfigurasi. firecrawl_scrapememerlukan kunci API.maxAgeMsmengontrol seberapa lama hasil cache boleh digunakan (ms). Defaultnya adalah 2 hari.- Konfigurasi lama
tools.web.fetch.firecrawl.*dimigrasikan otomatis olehopenclaw doctor --fix. - Override URL scrape/dasar Firecrawl mengikuti aturan terhosting/privat yang sama seperti pencarian: lalu lintas terhosting publik menggunakan
https://api.firecrawl.dev; override yang di-hosting sendiri harus mengarah ke endpoint privat/internal. firecrawl_scrapemenolak URL target privat, loopback, metadata, dan non-HTTP(S) yang jelas sebelum meneruskannya ke Firecrawl, sesuai dengan kontrak keamanan targetweb_fetchuntuk panggilan scrape Firecrawl eksplisit.
firecrawl_scrape menggunakan ulang pengaturan dan env var plugins.entries.firecrawl.config.webFetch.* yang sama, termasuk kunci API yang diwajibkan.
Firecrawl yang di-hosting sendiri
Tetapkan plugins.entries.firecrawl.config.webSearch.baseUrl,
plugins.entries.firecrawl.config.webFetch.baseUrl, atau FIRECRAWL_BASE_URL
saat Anda menjalankan Firecrawl sendiri. OpenClaw menerima http:// hanya untuk target loopback,
jaringan privat, .local, .internal, atau .localhost. Host kustom publik
ditolak agar kunci API Firecrawl tidak terkirim ke endpoint sembarang secara
tidak sengaja.
Alat Plugin Firecrawl
firecrawl_search
Gunakan ini saat Anda menginginkan kontrol pencarian khusus Firecrawl, bukan web_search generik.
Parameter inti:
querycountsourcescategoriesscrapeResultstimeoutSeconds
firecrawl_scrape
Gunakan ini untuk halaman berat JS atau dilindungi bot, tempat web_fetch biasa kurang kuat.
Parameter inti:
urlextractModemaxCharsonlyMainContentmaxAgeMsproxystoreInCachetimeoutSeconds
Stealth / pengelakan bot
Firecrawl mengekspos parameter mode proxy untuk pengelakan bot (basic, stealth, atau auto).
OpenClaw selalu menggunakan proxy: "auto" plus storeInCache: true untuk permintaan Firecrawl.
Jika proxy dihilangkan, Firecrawl secara default menggunakan auto. auto mencoba ulang dengan proxy stealth jika upaya dasar gagal, yang mungkin menggunakan lebih banyak kredit
daripada scraping basic-only.
Cara web_fetch menggunakan Firecrawl
Urutan ekstraksi web_fetch:
- Readability (lokal)
- Firecrawl (saat dipilih, atau terdeteksi otomatis dari kredensial yang dikonfigurasi)
- Pembersihan HTML dasar (fallback terakhir)
Kenop pemilihannya adalah tools.web.fetch.provider. Jika Anda menghilangkannya, OpenClaw
mendeteksi otomatis penyedia web-fetch pertama yang siap dari kredensial yang tersedia.
Plugin Firecrawl resmi menyediakan fallback tersebut.
Terkait
- Ringkasan Web Search -- semua penyedia dan deteksi otomatis
- Web Fetch -- alat web_fetch dengan fallback Firecrawl
- Tavily -- alat pencarian + ekstraksi