Tools
Alat PDF
pdf menganalisis satu atau beberapa dokumen PDF dan mengembalikan teks.
Perilaku cepat:
- Mode penyedia bawaan untuk penyedia model Anthropic dan Google.
- Mode cadangan ekstraksi untuk penyedia lain (ekstrak teks terlebih dahulu, lalu gambar halaman bila diperlukan).
- Mendukung input tunggal (
pdf) atau multi (pdfs), maksimum 10 PDF per panggilan.
Ketersediaan
Alat ini hanya didaftarkan ketika OpenClaw dapat menyelesaikan konfigurasi model berkemampuan PDF untuk agen:
agents.defaults.pdfModel- cadangan ke
agents.defaults.imageModel - cadangan ke model sesi/default agen yang terselesaikan
- jika penyedia PDF bawaan didukung autentikasi, prioritaskan mereka sebelum kandidat cadangan gambar generik
Jika tidak ada model yang dapat digunakan yang bisa diselesaikan, alat pdf tidak diekspos.
Catatan ketersediaan:
- Rantai cadangan sadar autentikasi.
provider/modelyang dikonfigurasi hanya dihitung jika OpenClaw benar-benar dapat mengautentikasi penyedia tersebut untuk agen. - Penyedia PDF bawaan saat ini adalah Anthropic dan Google.
- Jika penyedia sesi/default yang terselesaikan sudah memiliki model visi/PDF yang dikonfigurasi, alat PDF menggunakan ulang model itu sebelum beralih ke penyedia lain yang didukung autentikasi.
Referensi input
pdfstringSatu jalur atau URL PDF.
pdfsstring[]Beberapa jalur atau URL PDF, hingga total 10.
promptstringdefault: Analyze this PDF document.Prompt analisis.
pagesstringFilter halaman seperti 1-5 atau 1,3,7-9.
passwordstringKata sandi untuk PDF terenkripsi dalam mode cadangan ekstraksi.
modelstringOverride model opsional dalam bentuk provider/model.
maxBytesMbnumberBatas ukuran per PDF dalam MB. Default ke agents.defaults.pdfMaxBytesMb atau 10.
Catatan input:
pdfdanpdfsdigabungkan dan dideduplikasi sebelum dimuat.- Jika tidak ada input PDF yang diberikan, alat menghasilkan galat.
pagesdiurai sebagai nomor halaman berbasis 1, dideduplikasi, diurutkan, dan dibatasi ke maksimum halaman yang dikonfigurasi.passwordberlaku untuk setiap PDF dalam permintaan dan hanya digunakan oleh mode cadangan ekstraksi.maxBytesMbdefault keagents.defaults.pdfMaxBytesMbatau10.
Referensi PDF yang didukung
- jalur file lokal (termasuk ekspansi
~) - URL
file:// - URL
http://danhttps:// - referensi masuk yang dikelola OpenClaw seperti
media://inbound/<id>
Catatan referensi:
- Skema URI lain (misalnya
ftp://) ditolak denganunsupported_pdf_reference. - Dalam mode sandbox, URL
http(s)jarak jauh ditolak. - Dengan kebijakan file khusus ruang kerja diaktifkan, jalur file lokal di luar root yang diizinkan ditolak.
- Referensi masuk terkelola dan jalur yang diputar ulang di bawah penyimpanan media masuk OpenClaw diizinkan dengan kebijakan file khusus ruang kerja.
Mode eksekusi
Mode penyedia bawaan
Mode bawaan digunakan untuk penyedia anthropic dan google.
Alat mengirim byte PDF mentah langsung ke API penyedia.
Batas mode bawaan:
pagestidak didukung. Jika diatur, alat mengembalikan galat.passwordtidak didukung. Gunakan model non-bawaan untuk menganalisis PDF terenkripsi.- Input multi-PDF didukung; setiap PDF dikirim sebagai blok dokumen bawaan / bagian PDF inline sebelum prompt.
Mode cadangan ekstraksi
Mode cadangan digunakan untuk penyedia non-bawaan.
Alur:
- Ekstrak teks dari halaman yang dipilih (hingga
agents.defaults.pdfMaxPages, default20). - Jika panjang teks yang diekstrak di bawah
200karakter, render halaman yang dipilih menjadi gambar PNG dan sertakan gambar tersebut. - Kirim konten yang diekstrak beserta prompt ke model yang dipilih.
Detail cadangan:
- Ekstraksi gambar halaman menggunakan anggaran piksel
4,000,000. - PDF terenkripsi dapat dibuka dengan parameter tingkat atas
password. - Jika model target tidak mendukung input gambar dan tidak ada teks yang dapat diekstrak, alat menghasilkan galat.
- Jika ekstraksi teks berhasil tetapi ekstraksi gambar akan membutuhkan visi pada model khusus teks, OpenClaw membuang gambar yang dirender dan melanjutkan dengan teks yang diekstrak.
- Cadangan ekstraksi menggunakan Plugin
document-extractbawaan. Plugin memilikiclawpdf, yang menyediakan ekstraksi teks dan rendering gambar melalui PDFium WebAssembly.
Konfigurasi
{ agents: { defaults: { pdfModel: { primary: "anthropic/claude-opus-4-6", fallbacks: ["openai/gpt-5.4-mini"], }, pdfMaxBytesMb: 10, pdfMaxPages: 20, }, },}Lihat Referensi Konfigurasi untuk detail lengkap kolom.
Detail output
Alat mengembalikan teks di content[0].text dan metadata terstruktur di details.
Kolom details umum:
model: referensi model yang terselesaikan (provider/model)native:trueuntuk mode penyedia bawaan,falseuntuk cadanganattempts: upaya cadangan yang gagal sebelum berhasil
Kolom jalur:
- input PDF tunggal:
details.pdf - input beberapa PDF:
details.pdfs[]dengan entripdf - metadata penulisan ulang jalur sandbox (bila berlaku):
rewrittenFrom
Perilaku galat
- Input PDF hilang: melempar
pdf required: provide a path or URL to a PDF document - Terlalu banyak PDF: mengembalikan galat terstruktur di
details.error = "too_many_pdfs" - Skema referensi tidak didukung: mengembalikan
details.error = "unsupported_pdf_reference" - Mode bawaan dengan
pages: melempar galat jelaspages is not supported with native PDF providers
Contoh
PDF tunggal:
{ "pdf": "/tmp/report.pdf", "prompt": "Summarize this report in 5 bullets"}Beberapa PDF:
{ "pdfs": ["/tmp/q1.pdf", "/tmp/q2.pdf"], "prompt": "Compare risks and timeline changes across both documents"}Model cadangan dengan filter halaman:
{ "pdf": "https://example.com/report.pdf", "pages": "1-3,7", "model": "openai/gpt-5.4-mini", "prompt": "Extract only customer-impacting incidents"}PDF terenkripsi dengan cadangan ekstraksi:
{ "pdf": "/tmp/locked.pdf", "password": "example-password", "model": "openai/gpt-5.4-mini", "prompt": "Summarize this contract"}Terkait
- Ikhtisar Alat - semua alat agen yang tersedia
- Referensi Konfigurasi - konfigurasi pdfMaxBytesMb dan pdfMaxPages