Tools
Firecrawl
يمكن لـ OpenClaw استخدام Firecrawl بثلاث طرق:
- بوصفه موفّر
web_search - كأدوات Plugin صريحة:
firecrawl_searchوfirecrawl_scrape - كمستخرج احتياطي لـ
web_fetch
إنه خدمة مستضافة للاستخراج/البحث تدعم التحايل على البوتات والتخزين المؤقت، وهذا يساعد مع المواقع كثيفة JavaScript أو الصفحات التي تحظر جلب HTTP العادي.
تثبيت Plugin
ثبّت Plugin الرسمي، ثم أعد تشغيل Gateway:
openclaw plugins install @openclaw/firecrawl-pluginopenclaw gateway restartweb_fetch بلا مفتاح ومفاتيح API
يدعم احتياطي web_fetch المستضاف من Firecrawl والمحدد صراحة وصولًا أوليًا
من دون مفتاح API. أضف FIRECRAWL_API_KEY في بيئة gateway
أو اضبطه عندما تحتاج إلى حدود أعلى. يتطلب Firecrawl web_search و
firecrawl_scrape مفتاح API.
إعداد بحث Firecrawl
{ tools: { web: { search: { provider: "firecrawl", }, }, }, plugins: { entries: { firecrawl: { enabled: true, config: { webSearch: { apiKey: "FIRECRAWL_API_KEY_HERE", baseUrl: "https://api.firecrawl.dev", }, }, }, }, },}ملاحظات:
- يؤدي اختيار Firecrawl أثناء الإعداد الأولي أو عبر
openclaw configure --section webإلى تمكين Plugin Firecrawl المثبّت تلقائيًا. - يدعم
web_searchمع Firecrawl المعاملينqueryوcount. - لعناصر تحكم Firecrawl الخاصة مثل
sourcesأوcategoriesأو كشط النتائج، استخدمfirecrawl_search. - القيمة الافتراضية لـ
baseUrlهي Firecrawl المستضاف عندhttps://api.firecrawl.dev. لا يُسمح بتجاوزات الاستضافة الذاتية إلا لنقاط النهاية الخاصة/الداخلية؛ ولا يُقبل HTTP إلا لهذه الأهداف الخاصة. FIRECRAWL_BASE_URLهو احتياطي البيئة المشترك لعناوين URL الأساسية للبحث والكشط في Firecrawl.
إعداد احتياطي Firecrawl لـ web_fetch
{ tools: { web: { fetch: { provider: "firecrawl", // explicit selection enables keyless fallback }, }, }, plugins: { entries: { firecrawl: { enabled: true, config: { webFetch: { baseUrl: "https://api.firecrawl.dev", onlyMainContent: true, maxAgeMs: 172800000, timeoutSeconds: 60, }, }, }, }, },}ملاحظات:
- يعمل احتياطي
web_fetchمن Firecrawl والمحدد صراحة من دون مفتاح API. عند ضبطه، يرسل OpenClaw القيمةplugins.entries.firecrawl.config.webFetch.apiKeyأوFIRECRAWL_API_KEYللحصول على حدود أعلى. - يؤدي اختيار Firecrawl أثناء الإعداد الأولي أو عبر
openclaw configure --section webإلى تمكين Plugin واختيار Firecrawl لـweb_fetchما لم يكن موفّر جلب آخر مضبوطًا بالفعل. - يتطلب
firecrawl_scrapeمفتاح API. - يتحكم
maxAgeMsفي مدى قِدم النتائج المخزنة مؤقتًا المسموح به (بالملي ثانية). القيمة الافتراضية يومان. - تتم ترحيل إعدادات
tools.web.fetch.firecrawl.*القديمة تلقائيًا بواسطةopenclaw doctor --fix. - تتبع تجاوزات عنوان URL الأساسي/الكشط في Firecrawl قاعدة الاستضافة/الخصوصية نفسها المتبعة في البحث: يستخدم المرور العام المستضاف
https://api.firecrawl.dev؛ ويجب أن تتحلل تجاوزات الاستضافة الذاتية إلى نقاط نهاية خاصة/داخلية. - يرفض
firecrawl_scrapeعناوين URL الهدف الخاصة وذات loopback والبيانات الوصفية وغير HTTP(S) الواضحة قبل تمريرها إلى Firecrawl، بما يطابق عقد سلامة الهدف فيweb_fetchلاستدعاءات كشط Firecrawl الصريحة.
يعيد firecrawl_scrape استخدام إعدادات ومتغيرات البيئة نفسها في plugins.entries.firecrawl.config.webFetch.*، بما في ذلك مفتاح API المطلوب.
Firecrawl مستضاف ذاتيًا
اضبط plugins.entries.firecrawl.config.webSearch.baseUrl،
أو plugins.entries.firecrawl.config.webFetch.baseUrl، أو FIRECRAWL_BASE_URL
عندما تشغّل Firecrawl بنفسك. يقبل OpenClaw استخدام http:// فقط لأهداف loopback،
أو الشبكات الخاصة، أو .local، أو .internal، أو .localhost. تُرفض المضيفات
العامة المخصصة حتى لا تُرسل مفاتيح API الخاصة بـ Firecrawl إلى نقاط نهاية عشوائية
عن طريق الخطأ.
أدوات Plugin Firecrawl
firecrawl_search
استخدم هذا عندما تريد عناصر تحكم بحث خاصة بـ Firecrawl بدلًا من web_search العام.
المعاملات الأساسية:
querycountsourcescategoriesscrapeResultstimeoutSeconds
firecrawl_scrape
استخدم هذا للصفحات كثيفة JavaScript أو المحمية من البوتات حيث يكون web_fetch العادي ضعيفًا.
المعاملات الأساسية:
urlextractModemaxCharsonlyMainContentmaxAgeMsproxystoreInCachetimeoutSeconds
التخفي / التحايل على البوتات
يعرض Firecrawl معامل وضع الوكيل للتحايل على البوتات (basic أو stealth أو auto).
يستخدم OpenClaw دائمًا proxy: "auto" مع storeInCache: true لطلبات Firecrawl.
إذا حُذف الوكيل، يستخدم Firecrawl القيمة الافتراضية auto. يعيد auto المحاولة باستخدام وكلاء التخفي إذا فشلت محاولة أساسية، وقد يستهلك ذلك أرصدة أكثر
من الكشط الأساسي فقط.
كيف يستخدم web_fetch Firecrawl
ترتيب الاستخراج في web_fetch:
- Readability (محلي)
- Firecrawl (عند تحديده، أو اكتشافه تلقائيًا من بيانات الاعتماد المضبوطة)
- تنظيف HTML الأساسي (آخر احتياطي)
مفتاح الاختيار هو tools.web.fetch.provider. إذا حذفته، يكتشف OpenClaw
تلقائيًا أول موفّر جاهز لجلب الويب من بيانات الاعتماد المتاحة.
يوفر Plugin Firecrawl الرسمي ذلك الاحتياطي.
ذو صلة
- نظرة عامة على بحث الويب -- جميع الموفّرين والاكتشاف التلقائي
- جلب الويب -- أداة web_fetch مع احتياطي Firecrawl
- Tavily -- أدوات البحث + الاستخراج