CLI commands
CLI wnioskowania
openclaw infer to kanoniczna bezgłowa powierzchnia dla przepływów pracy inferencji obsługiwanych przez dostawców.
Celowo eksponuje rodziny możliwości, a nie surowe nazwy RPC Gateway ani surowe identyfikatory narzędzi agenta.
Zamień infer w umiejętność
Skopiuj i wklej to do agenta:
Read https://docs.openclaw.ai/cli/infer, then create a skill that routes my common workflows to `openclaw infer`.Focus on model runs, image generation, video generation, audio transcription, TTS, web search, and embeddings.Dobra umiejętność oparta na infer powinna:
- mapować typowe intencje użytkownika na właściwe podpolecenie infer
- zawierać kilka kanonicznych przykładów infer dla obsługiwanych przepływów pracy
- preferować
openclaw infer ...w przykładach i sugestiach - unikać ponownego dokumentowania całej powierzchni infer w treści umiejętności
Typowy zakres umiejętności skoncentrowanej na infer:
openclaw infer model runopenclaw infer image generateopenclaw infer audio transcribeopenclaw infer tts convertopenclaw infer web searchopenclaw infer embedding create
Dlaczego używać infer
openclaw infer zapewnia jedno spójne CLI dla zadań inferencji obsługiwanych przez dostawców w OpenClaw.
Korzyści:
- Używaj dostawców i modeli już skonfigurowanych w OpenClaw zamiast tworzyć jednorazowe wrappery dla każdego backendu.
- Trzymaj przepływy pracy modeli, obrazów, transkrypcji audio, TTS, wideo, sieci Web i osadzania w jednym drzewie poleceń.
- Używaj stabilnego kształtu wyjścia
--jsondla skryptów, automatyzacji i przepływów pracy sterowanych przez agenta. - Preferuj własną powierzchnię OpenClaw, gdy zadanie zasadniczo polega na „uruchomieniu inferencji”.
- Używaj normalnej ścieżki lokalnej bez wymagania Gateway dla większości poleceń infer.
Do kompleksowych sprawdzeń dostawcy preferuj openclaw infer ..., gdy niższopoziomowe
testy dostawcy są już zielone. Ćwiczy to dostarczane CLI, ładowanie konfiguracji,
rozpoznawanie domyślnego agenta, aktywację dołączonego Plugin oraz współdzielone
środowisko wykonawcze możliwości przed wysłaniem żądania do dostawcy.
Drzewo poleceń
openclaw infer list inspect model run list inspect providers auth login auth logout auth status image generate edit describe describe-many providers audio transcribe providers tts convert voices providers status enable disable set-provider video generate describe providers web search fetch providers embedding create providersTypowe zadania
Ta tabela mapuje typowe zadania inferencji na odpowiadające im polecenie infer.
| Zadanie | Polecenie | Uwagi |
|---|---|---|
| Uruchom prompt tekstowy/modelu | openclaw infer model run --prompt "..." --json |
Domyślnie używa normalnej ścieżki lokalnej |
| Uruchom prompt modelu na obrazach | openclaw infer model run --prompt "Describe this" --file ./image.png --model provider/model |
Powtórz --file dla wielu wejść obrazów |
| Wygeneruj obraz | openclaw infer image generate --prompt "..." --json |
Użyj image edit, gdy zaczynasz od istniejącego pliku |
| Opisz plik obrazu lub URL | openclaw infer image describe --file ./image.png --prompt "..." --json |
--model musi być modelem z obsługą obrazów w formie <provider/model> |
| Transkrybuj audio | openclaw infer audio transcribe --file ./memo.m4a --json |
--model musi mieć formę <provider/model> |
| Zsyntetyzuj mowę | openclaw infer tts convert --text "..." --output ./speech.mp3 --json |
tts status jest zorientowane na Gateway |
| Wygeneruj wideo | openclaw infer video generate --prompt "..." --json |
Obsługuje wskazówki dostawcy, takie jak --resolution |
| Opisz plik wideo | openclaw infer video describe --file ./clip.mp4 --json |
--model musi mieć formę <provider/model> |
| Przeszukaj sieć Web | openclaw infer web search --query "..." --json |
|
| Pobierz stronę WWW | openclaw infer web fetch --url https://example.com --json |
|
| Utwórz osadzenia | openclaw infer embedding create --text "..." --json |
Zachowanie
openclaw infer ...jest główną powierzchnią CLI dla tych przepływów pracy.- Używaj
--json, gdy wyjście będzie konsumowane przez inne polecenie lub skrypt. - Używaj
--provideralbo--model provider/model, gdy wymagany jest konkretny backend. - Używaj
model run --thinking <level>, aby przekazać jednorazowy poziom myślenia/rozumowania (off,minimal,low,medium,high,adaptive,xhighalbomax), zachowując surowy przebieg. - Dla
image describe,audio transcribeivideo describeopcja--modelmusi używać formy<provider/model>. - Dla
image describeopcja--fileakceptuje ścieżki lokalne i adresy URL obrazów HTTP(S). Zdalne adresy URL używają normalnej polityki SSRF pobierania mediów. - Dla
image describejawne--modelnajpierw uruchamia ten dostawca/model, a następnie próbuje skonfigurowanychagents.defaults.imageModel.fallbacks, gdy wywołanie modelu się nie powiedzie. Błędy przygotowania wejścia, takie jak brakujące pliki lub nieobsługiwane adresy URL, kończą się niepowodzeniem przed próbami fallback. Model musi obsługiwać obrazy w katalogu modeli lub konfiguracji dostawcy.codex/<model>uruchamia ograniczony przebieg rozumienia obrazu przez serwer aplikacji Codex;openai/<model>używa ścieżki dostawcy OpenAI z uwierzytelnianiem przez klucz API albo OAuth ChatGPT/Codex. - Bezstanowe polecenia wykonania domyślnie używają trybu lokalnego.
- Polecenia stanu zarządzanego przez Gateway domyślnie używają Gateway.
- Normalna ścieżka lokalna nie wymaga działającego Gateway.
- Lokalne
model runto lekkie jednorazowe uzupełnienie dostawcy. Rozpoznaje skonfigurowany model agenta i uwierzytelnianie, ale nie uruchamia tury agenta czatu, nie ładuje narzędzi ani nie otwiera dołączonych serwerów MCP. model run --fileakceptuje pliki obrazów, wykrywa ich typ MIME i wysyła je z podanym promptem do wybranego modelu. Powtórz--filedla wielu obrazów.model run --fileodrzuca wejścia niebędące obrazami. Użyjinfer audio transcribedla plików audio iinfer video describedla plików wideo.model run --gatewayćwiczy routing Gateway, zapisane uwierzytelnianie, wybór dostawcy i osadzone środowisko wykonawcze, ale nadal działa jako surowa próba modelu: wysyła podany prompt i wszelkie załączniki obrazów bez wcześniejszej transkrypcji sesji, kontekstu bootstrap/AGENTS, składania context-engine, narzędzi ani dołączonych serwerów MCP.model run --gateway --model <provider/model>wymaga zaufanego poświadczenia operatora Gateway, ponieważ żądanie prosi Gateway o uruchomienie jednorazowego nadpisania dostawcy/modelu.- Lokalne
model run --thinkingużywa lekkiej ścieżki uzupełniania dostawcy; poziomy specyficzne dla dostawcy, takie jakadaptiveimax, są mapowane na najbliższy przenośny poziom prostego uzupełniania.
Model
Używaj model do inferencji tekstowej obsługiwanej przez dostawców oraz inspekcji modelu/dostawcy.
openclaw infer model run --prompt "Reply with exactly: smoke-ok" --jsonopenclaw infer model run --prompt "Summarize this changelog entry" --model openai/gpt-5.4 --jsonopenclaw infer model run --prompt "Describe this image in one sentence" --file ./photo.jpg --model google/gemini-2.5-flash --jsonopenclaw infer model run --prompt "Use more reasoning here" --thinking high --jsonopenclaw infer model providers --jsonopenclaw infer model inspect --name gpt-5.5 --jsonUżywaj pełnych odwołań <provider/model>, aby wykonać smoke test konkretnego dostawcy bez
uruchamiania Gateway ani ładowania pełnej powierzchni narzędzi agenta:
openclaw infer model run --local --model anthropic/claude-sonnet-4-6 --prompt "Reply with exactly: pong" --jsonopenclaw infer model run --local --model cerebras/zai-glm-4.7 --prompt "Reply with exactly: pong" --jsonopenclaw infer model run --local --model google/gemini-2.5-flash --prompt "Reply with exactly: pong" --jsonopenclaw infer model run --local --model groq/llama-3.1-8b-instant --prompt "Reply with exactly: pong" --jsonopenclaw infer model run --local --model mistral/mistral-medium-3-5 --prompt "Reply with exactly: pong" --jsonopenclaw infer model run --local --model mistral/mistral-small-latest --prompt "Reply with exactly: pong" --jsonopenclaw infer model run --local --model openai/gpt-5.5 --prompt "Reply with exactly: pong" --jsonopenclaw infer model run --local --model ollama/qwen2.5vl:7b --prompt "Describe this image." --file ./photo.jpg --jsonUwagi:
- Lokalne
model runjest najwęższym smoke testem CLI dla kondycji dostawcy/modelu/uwierzytelniania, ponieważ w przypadku dostawców innych niż Codex wysyła tylko podany prompt do wybranego modelu. - Lokalne
model run --model <provider/model>może używać dokładnych dołączonych statycznych wierszy katalogu zmodels list --all, zanim ten dostawca zostanie zapisany w konfiguracji. Uwierzytelnianie dostawcy nadal jest wymagane; brakujące poświadczenia kończą się błędami uwierzytelniania, a nieUnknown model. - Dla prób rozumowania Mistral Medium 3.5 pozostaw temperaturę nieustawioną/domyślną. Mistral odrzuca
reasoning_effort="high"plustemperature: 0; użyjmistral/mistral-medium-3-5z domyślną temperaturą albo niezerową wartością trybu rozumowania, taką jak0.7. - Lokalne próby Codex Responses są wąskim wyjątkiem: OpenClaw dodaje minimalną instrukcję systemową, aby transport mógł wypełnić wymagane pole
instructions, bez dodawania pełnego kontekstu agenta, narzędzi, pamięci ani transkrypcji sesji. - Lokalne
model run --filezachowuje tę lekką ścieżkę i dołącza zawartość obrazu bezpośrednio do pojedynczej wiadomości użytkownika. Typowe pliki obrazów, takie jak PNG, JPEG i WebP, działają, gdy ich typ MIME zostanie wykryty jakoimage/*; nieobsługiwane lub nierozpoznane pliki kończą się niepowodzeniem przed wywołaniem dostawcy. model run --filejest najlepsze, gdy chcesz bezpośrednio przetestować wybrany multimodalny model tekstowy. Użyjinfer image describe, gdy chcesz skorzystać z wyboru dostawcy rozumienia obrazu w OpenClaw i domyślnego routingu modelu obrazu.- Wybrany model musi obsługiwać wejście obrazu; modele wyłącznie tekstowe mogą odrzucić żądanie na warstwie dostawcy.
model run --promptmusi zawierać tekst inny niż białe znaki; puste prompty są odrzucane przed wywołaniem lokalnych dostawców lub Gateway.- Lokalne
model runkończy się kodem niezerowym, gdy dostawca nie zwraca wyjścia tekstowego, więc nieosiągalni lokalni dostawcy i puste uzupełnienia nie wyglądają jak udane próby. - Użyj
model run --gateway, gdy musisz przetestować routing Gateway, konfigurację agent-runtime albo stan dostawcy zarządzany przez Gateway, zachowując surowe wejście modelu. Użyjopenclaw agentalbo powierzchni czatu, gdy potrzebujesz pełnego kontekstu agenta, narzędzi, pamięci i transkrypcji sesji. model auth login,model auth logoutimodel auth statuszarządzają zapisanym stanem uwierzytelniania dostawcy.
Obraz
Używaj image do generowania, edycji i opisu.
openclaw infer image generate --prompt "friendly lobster illustration" --jsonopenclaw infer image generate --prompt "cinematic product photo of headphones" --jsonopenclaw infer image generate --model openai/gpt-image-1.5 --output-format png --background transparent --prompt "simple red circle sticker on a transparent background" --jsonopenclaw infer image generate --model openai/gpt-image-2 --quality low --openai-moderation low --prompt "low-cost draft poster" --jsonopenclaw infer image generate --prompt "slow image backend" --timeout-ms 180000 --jsonopenclaw infer image edit --file ./logo.png --model openai/gpt-image-1.5 --output-format png --background transparent --prompt "keep the logo, remove the background" --jsonopenclaw infer image edit --file ./poster.png --prompt "make this a vertical story ad" --size 2160x3840 --aspect-ratio 9:16 --resolution 4K --jsonopenclaw infer image describe --file ./photo.jpg --jsonopenclaw infer image describe --file https://example.com/photo.png --jsonopenclaw infer image describe --file ./receipt.jpg --prompt "Extract the merchant, date, and total" --jsonopenclaw infer image describe-many --file ./before.png --file ./after.png --prompt "Compare the screenshots and list visible UI changes" --jsonopenclaw infer image describe --file ./ui-screenshot.png --model openai/gpt-5.4-mini --jsonopenclaw infer image describe --file ./photo.jpg --model ollama/qwen2.5vl:7b --prompt "Describe the image in one sentence" --timeout-ms 300000 --jsonUwagi:
-
Użyj
image edit, gdy zaczynasz od istniejących plików wejściowych. -
Użyj
--size,--aspect-ratiolub--resolutionzimage editdla dostawców/modeli, które obsługują wskazówki geometrii przy edycjach obrazów referencyjnych. -
Użyj
--output-format png --background transparentz--model openai/gpt-image-1.5dla wyjścia OpenAI PNG z przezroczystym tłem;--openai-backgroundpozostaje dostępne jako alias specyficzny dla OpenAI. Dostawcy, którzy nie deklarują obsługi tła, zgłaszają tę wskazówkę jako zignorowane nadpisanie. -
Użyj
--quality low|medium|high|autodla dostawców, którzy obsługują wskazówki jakości obrazu, w tym OpenAI. OpenAI akceptuje także--openai-moderation low|autojako wskazówkę moderacji specyficzną dla dostawcy. -
Użyj
image providers --json, aby sprawdzić, którzy wbudowani dostawcy obrazów są wykrywalni, skonfigurowani, wybrani oraz jakie możliwości generowania/edycji udostępnia każdy dostawca. -
Użyj
image generate --model <provider/model> --jsonjako najwęższego żywego dymnego testu CLI dla zmian w generowaniu obrazów. Przykład:bash openclaw infer image providers --jsonopenclaw infer image generate \ --model google/gemini-3.1-flash-image-preview \ --prompt "Minimal flat test image: one blue square on a white background, no text." \ --output ./openclaw-infer-image-smoke.png \ --jsonOdpowiedź JSON raportuje
ok,provider,model,attemptsoraz zapisane ścieżki wyjściowe. Gdy ustawiono--output, końcowe rozszerzenie może odpowiadać typowi MIME zwróconemu przez dostawcę. -
Dla
image describeiimage describe-manyużyj--prompt, aby przekazać modelowi wizyjnemu instrukcję specyficzną dla zadania, taką jak OCR, porównanie, inspekcja UI lub zwięzły podpis. -
Użyj
--timeout-msz wolnymi lokalnymi modelami wizyjnymi lub zimnymi startami Ollama. -
Dla
image describe--modelmusi być obsługującym obrazy<provider/model>. Gdy jest ustawiony, OpenClaw najpierw próbuje tego jawnego modelu, a następnie skonfigurowanych zapasowych modeli obrazów, jeśli wywołanie modelu się nie powiedzie. -
Dla lokalnych modeli wizyjnych Ollama najpierw pobierz model i ustaw
OLLAMA_API_KEYna dowolną wartość zastępczą, na przykładollama-local. Zobacz Ollama.
Audio
Użyj audio do transkrypcji plików.
openclaw infer audio transcribe --file ./memo.m4a --jsonopenclaw infer audio transcribe --file ./team-sync.m4a --language en --prompt "Focus on names and action items" --jsonopenclaw infer audio transcribe --file ./memo.m4a --model openai/whisper-1 --jsonUwagi:
audio transcribesłuży do transkrypcji plików, nie do zarządzania sesją w czasie rzeczywistym.--modelmusi mieć postać<provider/model>.
TTS
Użyj tts do syntezy mowy i stanu dostawcy TTS.
openclaw infer tts convert --text "hello from openclaw" --output ./hello.mp3 --jsonopenclaw infer tts convert --text "Your build is complete" --output ./build-complete.mp3 --jsonopenclaw infer tts providers --jsonopenclaw infer tts status --jsonUwagi:
tts statusdomyślnie używa gateway, ponieważ odzwierciedla stan TTS zarządzany przez gateway.- Użyj
tts providers,tts voicesitts set-provider, aby sprawdzić i skonfigurować zachowanie TTS.
Wideo
Użyj video do generowania i opisu.
openclaw infer video generate --prompt "cinematic sunset over the ocean" --jsonopenclaw infer video generate --prompt "slow drone shot over a forest lake" --resolution 768P --duration 6 --jsonopenclaw infer video describe --file ./clip.mp4 --jsonopenclaw infer video describe --file ./clip.mp4 --model openai/gpt-5.4-mini --jsonUwagi:
video generateakceptuje--size,--aspect-ratio,--resolution,--duration,--audio,--watermarki--timeout-msoraz przekazuje je do środowiska wykonawczego generowania wideo.--modelmusi mieć postać<provider/model>dlavideo describe.
Web
Użyj web do przepływów pracy wyszukiwania i pobierania.
openclaw infer web search --query "OpenClaw docs" --jsonopenclaw infer web search --query "OpenClaw infer web providers" --jsonopenclaw infer web fetch --url https://docs.openclaw.ai/cli/infer --jsonopenclaw infer web providers --jsonUwagi:
- Użyj
web providers, aby sprawdzić dostępnych, skonfigurowanych i wybranych dostawców.
Osadzanie
Użyj embedding do tworzenia wektorów i inspekcji dostawcy osadzania.
openclaw infer embedding create --text "friendly lobster" --jsonopenclaw infer embedding create --text "customer support ticket: delayed shipment" --model openai/text-embedding-3-large --jsonopenclaw infer embedding providers --jsonWyjście JSON
Polecenia infer normalizują wyjście JSON we wspólnej kopercie:
{ "ok": true, "capability": "image.generate", "transport": "local", "provider": "openai", "model": "gpt-image-2", "attempts": [], "outputs": []}Pola najwyższego poziomu są stabilne:
okcapabilitytransportprovidermodelattemptsoutputserror
Dla poleceń generowania multimediów outputs zawiera pliki zapisane przez OpenClaw. Używaj
path, mimeType, size oraz wszelkich wymiarów specyficznych dla mediów w tej tablicy
do automatyzacji zamiast parsowania czytelnego dla człowieka stdout.
Typowe pułapki
# Badopenclaw infer media image generate --prompt "friendly lobster" # Goodopenclaw infer image generate --prompt "friendly lobster"# Badopenclaw infer audio transcribe --file ./memo.m4a --model whisper-1 --json # Goodopenclaw infer audio transcribe --file ./memo.m4a --model openai/whisper-1 --jsonUwagi
openclaw capability ...jest aliasem dlaopenclaw infer ....