Testing
Тестування: живі набори тестів
Для швидкого старту, QA-ранерів, модульних/інтеграційних наборів і Docker-потоків див. Тестування. Ця сторінка описує live (із доступом до мережі) тестові набори: матрицю моделей, CLI-бекенди, ACP і live-тести медіапровайдерів, а також обробку облікових даних.
Live: локальні smoke-команди
Експортуйте потрібний ключ провайдера в середовище процесу перед ad hoc live перевірками.
Безпечний медіа-smoke:
pnpm openclaw infer tts convert --local --json \ --text "OpenClaw live smoke." \ --output /tmp/openclaw-live-smoke.mp3Безпечний smoke готовності голосового виклику:
pnpm openclaw voicecall setup --jsonpnpm openclaw voicecall smoke --to "+15555550123"voicecall smoke є dry run, якщо також не вказано --yes. Використовуйте --yes лише
тоді, коли ви навмисно хочете здійснити реальний сповіщувальний дзвінок. Для Twilio, Telnyx і
Plivo успішна перевірка готовності потребує публічного Webhook URL; local loopback/приватні
резервні варіанти відхиляються за задумом.
Live: перевірка можливостей Android-вузла
- Тест:
src/gateway/android-node.capabilities.live.test.ts - Скрипт:
pnpm android:test:integration - Мета: викликати кожну команду, яку наразі оголошує підключений Android-вузол, і перевірити поведінку контракту команди.
- Обсяг:
- Попередньо підготовлене/ручне налаштування (набір не встановлює/запускає/сполучає застосунок).
- Покомандна перевірка gateway
node.invokeдля вибраного Android-вузла.
- Обов’язкове попереднє налаштування:
- Android-застосунок уже підключений і сполучений із gateway.
- Застосунок утримується на передньому плані.
- Дозволи/згода на захоплення надані для можливостей, які ви очікуєте успішно пройти.
- Необов’язкові перевизначення цілі:
OPENCLAW_ANDROID_NODE_IDабоOPENCLAW_ANDROID_NODE_NAME.OPENCLAW_ANDROID_GATEWAY_URL/OPENCLAW_ANDROID_GATEWAY_TOKEN/OPENCLAW_ANDROID_GATEWAY_PASSWORD.
- Повні деталі налаштування Android: Android-застосунок
Live: model smoke (ключі профілю)
Live-тести розділені на два шари, щоб ми могли ізолювати збої:
- "Direct model" показує, чи провайдер/модель узагалі може відповісти з наданим ключем.
- "Gateway smoke" показує, чи повний конвеєр gateway+agent працює для цієї моделі (сеанси, історія, інструменти, політика sandbox тощо).
Шар 1: пряме завершення моделі (без gateway)
- Тест:
src/agents/models.profiles.live.test.ts - Мета:
- Перелічити виявлені моделі
- Використати
getApiKeyForModel, щоб вибрати моделі, для яких у вас є облікові дані - Запустити невелике завершення для кожної моделі (і цільові регресії, де потрібно)
- Як увімкнути:
pnpm test:live(абоOPENCLAW_LIVE_TEST=1, якщо запускаєте Vitest напряму)
- Задайте
OPENCLAW_LIVE_MODELS=modern,smallабоall(псевдонім для modern), щоб фактично запустити цей набір; інакше він пропускається, щобpnpm test:liveзалишався зосередженим на gateway smoke - Як вибрати моделі:
OPENCLAW_LIVE_MODELS=modern, щоб запустити сучасний allowlist (Opus/Sonnet 4.6+, GPT-5.2 + Codex, Gemini 3, DeepSeek V4, GLM 5.1, MiniMax M3, Grok 4.3)OPENCLAW_LIVE_MODELS=small, щоб запустити обмежений allowlist малих моделей (Qwen 8B/9B local-compatible routes, Ollama Gemma, OpenRouter Qwen/GLM і Z.AI GLM)OPENCLAW_LIVE_MODELS=allє псевдонімом сучасного allowlist- або
OPENCLAW_LIVE_MODELS="openai/gpt-5.5,anthropic/claude-opus-4-6,..."(allowlist через кому) - Локальні запуски малих моделей Ollama за замовчуванням використовують
http://127.0.0.1:11434; задавайтеOPENCLAW_LIVE_OLLAMA_BASE_URLлише для LAN, кастомних або Ollama Cloud endpoints. - Перевірки modern/all і small за замовчуванням використовують свої curated caps; задайте
OPENCLAW_LIVE_MAX_MODELS=0для вичерпної перевірки вибраних профілів або додатне число для меншого обмеження. - Вичерпні перевірки використовують
OPENCLAW_LIVE_TEST_TIMEOUT_MSяк таймаут усього direct-model тесту. За замовчуванням: 60 хвилин. - Direct-model probes за замовчуванням запускаються з паралелізмом 20; задайте
OPENCLAW_LIVE_MODEL_CONCURRENCY, щоб перевизначити.
- Як вибрати провайдерів:
OPENCLAW_LIVE_PROVIDERS="google,google-antigravity,google-gemini-cli"(allowlist через кому)
- Звідки беруться ключі:
- За замовчуванням: сховище профілів і резервні варіанти env
- Задайте
OPENCLAW_LIVE_REQUIRE_PROFILE_KEYS=1, щоб вимагати лише сховище профілів
- Навіщо це існує:
- Відокремлює "provider API is broken / key is invalid" від "gateway agent pipeline is broken"
- Містить невеликі ізольовані регресії (приклад: OpenAI Responses/Codex Responses reasoning replay + tool-call flows)
Шар 2: Gateway + dev agent smoke (що насправді робить "@openclaw")
- Тест:
src/gateway/gateway-models.profiles.live.test.ts - Мета:
- Запустити gateway у процесі
- Створити/виправити сеанс
agent:dev:*(перевизначення моделі для кожного запуску) - Перебрати моделі з ключами й перевірити:
- "змістовну" відповідь (без інструментів)
- працює реальний виклик інструмента (read probe)
- необов’язкові додаткові probe інструментів (exec+read probe)
- регресійні шляхи OpenAI (tool-call-only → follow-up) продовжують працювати
- Деталі probe (щоб можна було швидко пояснити збої):
readprobe: тест записує nonce-файл у workspace і просить agent виконатиreadйого та відлунити nonce назад.exec+readprobe: тест просить agent виконатиexec-запис nonce у тимчасовий файл, а потімreadйого назад.- image probe: тест додає згенерований PNG (cat + randomized code) і очікує, що модель поверне
cat <CODE>. - Посилання на реалізацію:
src/gateway/gateway-models.profiles.live.test.tsіtest/helpers/live-image-probe.ts.
- Як увімкнути:
pnpm test:live(абоOPENCLAW_LIVE_TEST=1, якщо запускаєте Vitest напряму)
- Як вибрати моделі:
- За замовчуванням: сучасний allowlist (Opus/Sonnet 4.6+, GPT-5.2 + Codex, Gemini 3, DeepSeek V4, GLM 4.7, MiniMax M3, Grok 4.3)
OPENCLAW_LIVE_GATEWAY_MODELS=small, щоб запустити той самий обмежений allowlist малих моделей через повний конвеєр gateway+agentOPENCLAW_LIVE_GATEWAY_MODELS=allє псевдонімом сучасного allowlist- Або задайте
OPENCLAW_LIVE_GATEWAY_MODELS="provider/model"(або список через кому), щоб звузити вибір - Перевірки gateway modern/all і small за замовчуванням використовують свої curated caps; задайте
OPENCLAW_LIVE_GATEWAY_MAX_MODELS=0для вичерпної вибраної перевірки або додатне число для меншого обмеження.
- Як вибрати провайдерів (уникнути "OpenRouter everything"):
OPENCLAW_LIVE_GATEWAY_PROVIDERS="google,google-antigravity,google-gemini-cli,openai,anthropic,zai,minimax"(allowlist через кому)
- Tool + image probes завжди ввімкнені в цьому live-тесті:
readprobe +exec+readprobe (навантаження на інструменти)- image probe запускається, коли модель оголошує підтримку введення зображень
- Потік (на високому рівні):
- Тест генерує крихітний PNG із "CAT" + випадковим кодом (
test/helpers/live-image-probe.ts) - Надсилає його через
agentattachments: [{ mimeType: "image/png", content: "<base64>" }] - Gateway розбирає вкладення в
images[](src/gateway/server-methods/agent.ts+src/gateway/chat-attachments.ts) - Вбудований agent пересилає мультимодальне повідомлення користувача до моделі
- Твердження: відповідь містить
cat+ код (допуск OCR: дозволені незначні помилки)
- Тест генерує крихітний PNG із "CAT" + випадковим кодом (
Live: smoke CLI-бекенду (Claude, Gemini або інші локальні CLI)
- Тест:
src/gateway/gateway-cli-backend.live.test.ts - Мета: перевірити конвеєр Gateway + agent за допомогою локального CLI-бекенду, не змінюючи вашу конфігурацію за замовчуванням.
- Smoke-значення за замовчуванням, специфічні для бекенду, живуть у визначенні
cli-backend.tsвідповідного plugin-власника. - Увімкнення:
pnpm test:live(абоOPENCLAW_LIVE_TEST=1, якщо запускаєте Vitest напряму)OPENCLAW_LIVE_CLI_BACKEND=1
- Значення за замовчуванням:
- Провайдер/модель за замовчуванням:
claude-cli/claude-sonnet-4-6 - Поведінка command/args/image походить із metadata plugin відповідного CLI-бекенду.
- Провайдер/модель за замовчуванням:
- Перевизначення (необов’язково):
OPENCLAW_LIVE_CLI_BACKEND_MODEL="claude-cli/claude-sonnet-4-6"OPENCLAW_LIVE_CLI_BACKEND_COMMAND="/full/path/to/claude"OPENCLAW_LIVE_CLI_BACKEND_ARGS='["-p","--output-format","json"]'OPENCLAW_LIVE_CLI_BACKEND_IMAGE_PROBE=1, щоб надіслати реальне вкладення-зображення (шляхи ін’єктуються в prompt). Docker-рецепти за замовчуванням вимикають це, якщо не запитано явно.OPENCLAW_LIVE_CLI_BACKEND_IMAGE_ARG="--image", щоб передавати шляхи до файлів зображень як CLI args замість ін’єкції в prompt.OPENCLAW_LIVE_CLI_BACKEND_IMAGE_MODE="repeat"(або"list"), щоб керувати тим, як image args передаються, коли заданоIMAGE_ARG.OPENCLAW_LIVE_CLI_BACKEND_RESUME_PROBE=1, щоб надіслати другий хід і перевірити resume flow.OPENCLAW_LIVE_CLI_BACKEND_MODEL_SWITCH_PROBE=1, щоб увімкнути перевірку безперервності того самого сеансу Claude Sonnet -> Opus, коли вибрана модель підтримує ціль перемикання. Docker-рецепти за замовчуванням вимикають це для сукупної надійності.OPENCLAW_LIVE_CLI_BACKEND_MCP_PROBE=1, щоб увімкнути MCP/tool loopback probe. Docker-рецепти за замовчуванням вимикають це, якщо не запитано явно.
Приклад:
OPENCLAW_LIVE_CLI_BACKEND=1 \ OPENCLAW_LIVE_CLI_BACKEND_MODEL="claude-cli/claude-sonnet-4-6" \ pnpm test:live src/gateway/gateway-cli-backend.live.test.tsДешевий smoke конфігурації Gemini MCP:
OPENCLAW_LIVE_TEST=1 \ pnpm test:live src/agents/cli-runner/bundle-mcp.gemini.live.test.tsЦе не просить Gemini генерувати відповідь. Він записує ті самі системні
налаштування, які OpenClaw дає Gemini, а потім запускає gemini --debug mcp list, щоб довести, що
збережений сервер transport: "streamable-http" нормалізується до HTTP MCP
форми Gemini і може підключитися до локального streamable-HTTP MCP server.
Docker-рецепт:
pnpm test:docker:live-cli-backendDocker-рецепти для окремих провайдерів:
pnpm test:docker:live-cli-backend:claudepnpm test:docker:live-cli-backend:claude-subscriptionpnpm test:docker:live-cli-backend:geminiПримітки:
- Docker-ранер розташований у
scripts/test-live-cli-backend-docker.sh. - Він запускає live CLI-backend smoke усередині Docker-образу репозиторію як непривілейований користувач
node. - Він визначає smoke metadata CLI з відповідного extension-власника, а потім встановлює відповідний Linux CLI package (
@anthropic-ai/claude-codeабо@google/gemini-cli) у кешований записуваний префіксOPENCLAW_DOCKER_CLI_TOOLS_DIR(за замовчуванням:~/.cache/openclaw/docker-cli-tools). pnpm test:docker:live-cli-backend:claude-subscriptionпотребує portable Claude Code subscription OAuth через~/.claude/.credentials.jsonзclaudeAiOauth.subscriptionTypeабоCLAUDE_CODE_OAUTH_TOKENзclaude setup-token. Спочатку він доводить directclaude -pу Docker, а потім виконує два ходи Gateway CLI-backend без збереження env vars Anthropic API-key. Цей subscription lane за замовчуванням вимикає Claude MCP/tool і image probes, бо він споживає ліміти використання підписки з авторизацією, а Anthropic може змінювати поведінку білінгу й rate-limit Claude Agent SDK /claude -pбез релізу OpenClaw.- Live CLI-backend smoke тепер виконує той самий наскрізний потік для Claude і Gemini: текстовий хід, хід класифікації зображення, а потім виклик MCP-інструмента
cron, перевірений через gateway CLI. - Smoke Claude за замовчуванням також виправляє сеанс із Sonnet на Opus і перевіряє, що відновлений сеанс досі пам’ятає попередню нотатку.
Live: досяжність APNs HTTP/2 proxy
- Тест:
src/infra/push-apns-http2.live.test.ts - Мета: тунелюватися через локальний HTTP CONNECT proxy до sandbox APNs endpoint Apple, надіслати APNs HTTP/2 validation request і перевірити, що реальна відповідь Apple
403 InvalidProviderTokenповертається через proxy path. - Увімкнення:
OPENCLAW_LIVE_TEST=1 OPENCLAW_LIVE_APNS_REACHABILITY=1 pnpm test:live src/infra/push-apns-http2.live.test.ts
- Необов’язковий таймаут:
OPENCLAW_LIVE_APNS_TIMEOUT_MS=30000
Live: ACP bind smoke (/acp spawn ... --bind here)
- Тест:
src/gateway/gateway-acp-bind.live.test.ts - Мета: перевірити реальний потік прив’язування ACP-розмови з live ACP-агентом:
- надіслати
/acp spawn <agent> --bind here - прив’язати синтетичну розмову message-channel на місці
- надіслати звичайне подальше повідомлення в тій самій розмові
- перевірити, що подальше повідомлення потрапляє до transcript прив’язаної ACP-сесії
- надіслати
- Увімкнення:
pnpm test:live src/gateway/gateway-acp-bind.live.test.tsOPENCLAW_LIVE_ACP_BIND=1
- Типові значення:
- ACP-агенти в Docker:
claude,codex,gemini - ACP-агент для прямого
pnpm test:live ...:claude - Синтетичний канал: контекст розмови в стилі Slack DM
- ACP-бекенд:
acpx
- ACP-агенти в Docker:
- Перевизначення:
OPENCLAW_LIVE_ACP_BIND_AGENT=claudeOPENCLAW_LIVE_ACP_BIND_AGENT=codexOPENCLAW_LIVE_ACP_BIND_AGENT=droidOPENCLAW_LIVE_ACP_BIND_AGENT=geminiOPENCLAW_LIVE_ACP_BIND_AGENT=opencodeOPENCLAW_LIVE_ACP_BIND_AGENTS=claude,codex,geminiOPENCLAW_LIVE_ACP_BIND_AGENT_COMMAND='npx -y @agentclientprotocol/claude-agent-acp@<version>'OPENCLAW_LIVE_ACP_BIND_CODEX_MODEL=gpt-5.5OPENCLAW_LIVE_ACP_BIND_OPENCODE_MODEL=opencode/kimi-k2.6OPENCLAW_LIVE_ACP_BIND_REQUIRE_TRANSCRIPT=1OPENCLAW_LIVE_ACP_BIND_REQUIRE_CRON=1OPENCLAW_LIVE_ACP_BIND_PARENT_MODEL=openai/gpt-5.5
- Нотатки:
- Ця lane використовує поверхню Gateway
chat.sendз admin-only синтетичними полями originating-route, щоб тести могли додавати контекст message-channel, не вдаючи зовнішню доставку. - Коли
OPENCLAW_LIVE_ACP_BIND_AGENT_COMMANDне задано, тест використовує вбудований реєстр агентів вбудованого Pluginacpxдля вибраного ACP harness-агента. - Створення bound-session cron MCP типово виконується best-effort, оскільки зовнішні ACP harnesses можуть скасувати MCP-виклики після проходження bind/image proof; задайте
OPENCLAW_LIVE_ACP_BIND_REQUIRE_CRON=1, щоб зробити цей post-bind cron-зонд строгим.
- Ця lane використовує поверхню Gateway
Приклад:
OPENCLAW_LIVE_ACP_BIND=1 \ OPENCLAW_LIVE_ACP_BIND_AGENT=claude \ pnpm test:live src/gateway/gateway-acp-bind.live.test.tsРецепт Docker:
pnpm test:docker:live-acp-bindРецепти Docker для одного агента:
pnpm test:docker:live-acp-bind:claudepnpm test:docker:live-acp-bind:codexpnpm test:docker:live-acp-bind:droidpnpm test:docker:live-acp-bind:geminipnpm test:docker:live-acp-bind:opencodeНотатки Docker:
- Docker runner розташований у
scripts/test-live-acp-bind-docker.sh. - Типово він послідовно запускає ACP bind smoke проти сукупних live CLI-агентів:
claude,codex, потімgemini. - Використовуйте
OPENCLAW_LIVE_ACP_BIND_AGENTS=claude,OPENCLAW_LIVE_ACP_BIND_AGENTS=codex,OPENCLAW_LIVE_ACP_BIND_AGENTS=droid,OPENCLAW_LIVE_ACP_BIND_AGENTS=geminiабоOPENCLAW_LIVE_ACP_BIND_AGENTS=opencode, щоб звузити матрицю. - Він готує відповідні матеріали автентифікації CLI в контейнері, потім встановлює потрібний live CLI (
@anthropic-ai/claude-code,@openai/codex, Factory Droid черезhttps://app.factory.ai/cli,@google/gemini-cliабоopencode-ai), якщо його немає. Сам ACP-бекенд є вбудованим пакетомacpx/runtimeз офіційного Pluginacpx. - Варіант Droid Docker готує
~/.factoryдля налаштувань, передаєFACTORY_API_KEYі потребує цього API-ключа, оскільки локальну автентифікацію Factory OAuth/keyring неможливо переносимо передати в контейнер. Він використовує вбудований registry entry ACPXdroid exec --output-format acp. - Варіант OpenCode Docker є строгою regression lane для одного агента. Він записує тимчасову типову модель
OPENCODE_CONFIG_CONTENTзOPENCLAW_LIVE_ACP_BIND_OPENCODE_MODEL(типовоopencode/kimi-k2.6), аpnpm test:docker:live-acp-bind:opencodeвимагає transcript прив’язаного асистента замість прийняття загального post-bind skip. - Прямі виклики CLI
acpxє лише ручним/обхідним шляхом для порівняння поведінки поза Gateway. Docker ACP bind smoke перевіряє вбудований runtime-бекендacpxOpenClaw.
Live: Codex app-server harness smoke
- Мета: перевірити Codex harness, яким володіє Plugin, через звичайний gateway
метод
agent:- завантажити bundled Plugin
codex - вибрати
openai/gpt-5.5, що типово маршрутизує agent turns OpenAI через Codex - надіслати перший gateway agent turn до
openai/gpt-5.5з вибраним Codex harness - надіслати другий turn до тієї самої сесії OpenClaw і перевірити, що app-server thread може відновитися
- запустити
/codex statusі/codex modelsчерез той самий шлях gateway command - необов’язково запустити два escalated shell-зонди, перевірені Guardian: одну безпечну команду, яку має бути схвалено, і одне вивантаження фальшивого секрету, яке має бути відхилено, щоб агент перепитав
- завантажити bundled Plugin
- Тест:
src/gateway/gateway-codex-harness.live.test.ts - Увімкнення:
OPENCLAW_LIVE_CODEX_HARNESS=1 - Типова модель:
openai/gpt-5.5 - Необов’язковий image-зонд:
OPENCLAW_LIVE_CODEX_HARNESS_IMAGE_PROBE=1 - Необов’язковий MCP/tool-зонд:
OPENCLAW_LIVE_CODEX_HARNESS_MCP_PROBE=1 - Необов’язковий Guardian-зонд:
OPENCLAW_LIVE_CODEX_HARNESS_GUARDIAN_PROBE=1 - Smoke примусово задає provider/model
agentRuntime.id: "codex", щоб зламаний Codex harness не міг пройти, тихо повернувшись до OpenClaw. - Автентифікація: автентифікація Codex app-server з локального входу в підписку Codex. Docker
smokes також можуть надавати
OPENAI_API_KEYдля non-Codex-зондів, коли застосовно, плюс необов’язково скопійовані~/.codex/auth.jsonі~/.codex/config.toml.
Локальний рецепт:
OPENCLAW_LIVE_CODEX_HARNESS=1 \ OPENCLAW_LIVE_CODEX_HARNESS_IMAGE_PROBE=1 \ OPENCLAW_LIVE_CODEX_HARNESS_MCP_PROBE=1 \ OPENCLAW_LIVE_CODEX_HARNESS_GUARDIAN_PROBE=1 \ OPENCLAW_LIVE_CODEX_HARNESS_MODEL=openai/gpt-5.5 \ pnpm test:live -- src/gateway/gateway-codex-harness.live.test.tsРецепт Docker:
pnpm test:docker:live-codex-harnessНотатки Docker:
- Docker runner розташований у
scripts/test-live-codex-harness-docker.sh. - Він передає
OPENAI_API_KEY, копіює файли автентифікації Codex CLI, коли вони присутні, встановлює@openai/codexу змонтований npm prefix із правом запису, готує дерево джерел, а потім запускає лише live-тест Codex-harness. - Docker типово вмикає image-, MCP/tool- і Guardian-зонди. Задайте
OPENCLAW_LIVE_CODEX_HARNESS_IMAGE_PROBE=0абоOPENCLAW_LIVE_CODEX_HARNESS_MCP_PROBE=0абоOPENCLAW_LIVE_CODEX_HARNESS_GUARDIAN_PROBE=0, коли потрібен вужчий debug запуск. - Docker використовує ту саму явну конфігурацію runtime Codex, тому legacy aliases або fallback OpenClaw не можуть приховати регресію Codex harness.
Рекомендовані live-рецепти
Вузькі, явні allowlists є найшвидшими та найменш flaky:
-
Одна модель, напряму (без gateway):
OPENCLAW_LIVE_MODELS="openai/gpt-5.5" pnpm test:live src/agents/models.profiles.live.test.ts
-
Прямий профіль small-model:
OPENCLAW_LIVE_MODELS=small pnpm test:live src/agents/models.profiles.live.test.ts
-
Gateway-профіль small-model:
OPENCLAW_LIVE_GATEWAY_MODELS=small pnpm test:live src/gateway/gateway-models.profiles.live.test.ts
-
Ollama Cloud API smoke:
OPENCLAW_LIVE_TEST=1 OPENCLAW_LIVE_OLLAMA=1 OPENCLAW_LIVE_OLLAMA_BASE_URL=https://ollama.com OPENCLAW_LIVE_OLLAMA_MODEL=glm-5.1:cloud OPENCLAW_LIVE_OLLAMA_WEB_SEARCH=0 pnpm test:live -- extensions/ollama/ollama.live.test.ts
-
Одна модель, gateway smoke:
OPENCLAW_LIVE_GATEWAY_MODELS="openai/gpt-5.5" pnpm test:live src/gateway/gateway-models.profiles.live.test.ts
-
Tool calling у кількох providers:
OPENCLAW_LIVE_GATEWAY_MODELS="openai/gpt-5.5,anthropic/claude-opus-4-6,google/gemini-3-flash-preview,deepseek/deepseek-v4-flash,zai/glm-5.1,minimax/MiniMax-M3" pnpm test:live src/gateway/gateway-models.profiles.live.test.ts
-
Z.AI Coding Plan GLM-5.2 direct smoke:
ZAI_CODING_LIVE_TEST=1 pnpm test:live src/agents/zai.live.test.ts
-
Фокус Google (Gemini API key + Antigravity):
- Gemini (API key):
OPENCLAW_LIVE_GATEWAY_MODELS="google/gemini-3-flash-preview" pnpm test:live src/gateway/gateway-models.profiles.live.test.ts - Antigravity (OAuth):
OPENCLAW_LIVE_GATEWAY_MODELS="google-antigravity/claude-opus-4-6-thinking,google-antigravity/gemini-3-pro-high" pnpm test:live src/gateway/gateway-models.profiles.live.test.ts
- Gemini (API key):
-
Google adaptive thinking smoke:
- Gemini 3 dynamic default:
pnpm openclaw qa manual --provider-mode live-frontier --model google/gemini-3.1-pro-preview --alt-model google/gemini-3.1-pro-preview --message '/think adaptive Reply exactly: GEMINI_ADAPTIVE_OK' --timeout-ms 180000 - Gemini 2.5 dynamic budget:
pnpm openclaw qa manual --provider-mode live-frontier --model google/gemini-2.5-flash --alt-model google/gemini-2.5-flash --message '/think adaptive Reply exactly: GEMINI25_ADAPTIVE_OK' --timeout-ms 180000
- Gemini 3 dynamic default:
Нотатки:
google/...використовує Gemini API (API key).google-antigravity/...використовує Antigravity OAuth bridge (agent endpoint у стилі Cloud Code Assist).google-gemini-cli/...використовує локальний Gemini CLI на вашій машині (окрема автентифікація + особливості tooling).- Gemini API проти Gemini CLI:
- API: OpenClaw викликає розміщений Gemini API Google через HTTP (API key / profile auth); це те, що більшість користувачів мають на увазі під "Gemini".
- CLI: OpenClaw запускає локальний binary
gemini; він має власну автентифікацію і може поводитися інакше (streaming/tool support/version skew).
Live: матриця моделей (що ми покриваємо)
Фіксованого "CI model list" немає (live є opt-in), але це рекомендовані моделі для регулярного покриття на машині розробника з ключами.
Сучасний smoke-набір (tool calling + image)
Це запуск "common models", який, як ми очікуємо, має продовжувати працювати:
- OpenAI (non-Codex):
openai/gpt-5.5 - OpenAI ChatGPT/Codex OAuth:
openai/gpt-5.5 - Anthropic:
anthropic/claude-opus-4-6(абоanthropic/claude-sonnet-4-6) - Google (Gemini API):
google/gemini-3.1-pro-previewіgoogle/gemini-3-flash-preview(уникайте старіших моделей Gemini 2.x) - Google (Antigravity):
google-antigravity/claude-opus-4-6-thinkingіgoogle-antigravity/gemini-3-flash - DeepSeek:
deepseek/deepseek-v4-flashіdeepseek/deepseek-v4-pro - Z.AI (GLM):
zai/glm-5.1(general API) абоzai/glm-5.2(Coding Plan) - MiniMax:
minimax/MiniMax-M3
Запустіть gateway smoke з tools + image:
OPENCLAW_LIVE_GATEWAY_MODELS="openai/gpt-5.5,anthropic/claude-opus-4-6,google/gemini-3.1-pro-preview,google/gemini-3-flash-preview,google-antigravity/claude-opus-4-6-thinking,google-antigravity/gemini-3-flash,deepseek/deepseek-v4-flash,zai/glm-5.1,minimax/MiniMax-M3" pnpm test:live src/gateway/gateway-models.profiles.live.test.ts
Базовий рівень: tool calling (Read + необов’язковий Exec)
Виберіть принаймні одну модель на кожну provider family:
- OpenAI:
openai/gpt-5.5 - Anthropic:
anthropic/claude-opus-4-6(абоanthropic/claude-sonnet-4-6) - Google:
google/gemini-3-flash-preview(абоgoogle/gemini-3.1-pro-preview) - DeepSeek:
deepseek/deepseek-v4-flash - Z.AI (GLM):
zai/glm-5.1(general API) абоzai/glm-5.2(Coding Plan) - MiniMax:
minimax/MiniMax-M3
Необов’язкове додаткове покриття (варто мати):
- xAI:
xai/grok-4.3(або остання доступна) - Mistral:
mistral/… (виберіть одну модель із підтримкою "tools", яку ви ввімкнули) - Cerebras:
cerebras/… (якщо маєте доступ) - LM Studio:
lmstudio/… (локально; tool calling залежить від API mode)
Vision: надсилання зображення (attachment → multimodal message)
Додайте принаймні одну модель із підтримкою зображень до OPENCLAW_LIVE_GATEWAY_MODELS (варіанти Claude/Gemini/OpenAI із підтримкою vision тощо), щоб перевірити image-зонд.
Aggregators / alternate gateways
Якщо у вас увімкнені ключі, ми також підтримуємо тестування через:
- OpenRouter:
openrouter/...(сотні моделей; використовуйтеopenclaw models scan, щоб знайти кандидатів із підтримкою tool+image) - OpenCode:
opencode/...для Zen іopencode-go/...для Go (автентифікація черезOPENCODE_API_KEY/OPENCODE_ZEN_API_KEY)
Більше providers, які можна додати до live-матриці (якщо у вас є credentials/config):
- Вбудовані:
openai,anthropic,google,google-vertex,google-antigravity,google-gemini-cli,zai,openrouter,opencode,opencode-go,xai,groq,cerebras,mistral,github-copilot - Через
models.providers(власні кінцеві точки):minimax(хмара/API), а також будь-який OpenAI/Anthropic-сумісний проксі (LM Studio, vLLM, LiteLLM тощо)
Облікові дані (ніколи не комітьте)
Live-тести виявляють облікові дані так само, як це робить CLI. Практичні наслідки:
-
Якщо CLI працює, live-тести мають знайти ті самі ключі.
-
Якщо live-тест повідомляє "no creds", налагоджуйте так само, як налагоджували б
openclaw models list/ вибір моделі. -
Профілі автентифікації для кожного агента:
~/.openclaw/agents/<agentId>/agent/auth-profiles.json(саме це означає "profile keys" у live-тестах) -
Конфігурація:
~/.openclaw/openclaw.json(абоOPENCLAW_CONFIG_PATH) -
Застарілий каталог стану:
~/.openclaw/credentials/(копіюється до підготовленого live-домашнього каталогу, якщо присутній, але не є основним сховищем ключів профілю) -
Локальні live-запуски за замовчуванням копіюють активну конфігурацію, файли
auth-profiles.jsonдля кожного агента, застарілийcredentials/і підтримувані зовнішні каталоги автентифікації CLI до тимчасового тестового домашнього каталогу; підготовлені live-домашні каталоги пропускаютьworkspace/іsandboxes/, а перевизначення шляхівagents.*.workspace/agentDirвилучаються, щоб проби не торкалися вашого справжнього робочого простору на хості.
Якщо ви хочете покладатися на ключі середовища, експортуйте їх перед локальними тестами або використовуйте
Docker-запускачі нижче з явним OPENCLAW_PROFILE_FILE.
Deepgram live (транскрибування аудіо)
- Тест:
extensions/deepgram/audio.live.test.ts - Увімкнення:
DEEPGRAM_API_KEY=... DEEPGRAM_LIVE_TEST=1 pnpm test:live extensions/deepgram/audio.live.test.ts
BytePlus coding plan live
- Тест:
extensions/byteplus/live.test.ts - Увімкнення:
BYTEPLUS_API_KEY=... BYTEPLUS_LIVE_TEST=1 pnpm test:live extensions/byteplus/live.test.ts - Необов’язкове перевизначення моделі:
BYTEPLUS_CODING_MODEL=ark-code-latest
ComfyUI workflow media live
- Тест:
extensions/comfy/comfy.live.test.ts - Увімкнення:
OPENCLAW_LIVE_TEST=1 COMFY_LIVE_TEST=1 pnpm test:live -- extensions/comfy/comfy.live.test.ts - Обсяг:
- Перевіряє вбудовані шляхи comfy для зображень, відео та
music_generate - Пропускає кожну можливість, якщо
plugins.entries.comfy.config.<capability>не налаштовано - Корисно після змін надсилання workflow comfy, опитування, завантажень або реєстрації plugin
- Перевіряє вбудовані шляхи comfy для зображень, відео та
Image generation live
- Тест:
test/image-generation.runtime.live.test.ts - Команда:
pnpm test:live test/image-generation.runtime.live.test.ts - Оснастка:
pnpm test:live:media image - Обсяг:
- Перелічує кожен зареєстрований plugin провайдера генерації зображень
- Використовує вже експортовані змінні середовища провайдера перед пробами
- За замовчуванням використовує live/env API-ключі перед збереженими профілями автентифікації, щоб застарілі тестові ключі в
auth-profiles.jsonне маскували справжні облікові дані оболонки - Пропускає провайдерів без придатної автентифікації/профілю/моделі
- Запускає кожного налаштованого провайдера через спільний runtime генерації зображень:
<provider>:generate<provider>:edit, коли провайдер заявляє підтримку редагування
- Поточні охоплені вбудовані провайдери:
deepinfrafalgoogleminimaxopenaiopenroutervydraxai
- Необов’язкове звуження:
OPENCLAW_LIVE_IMAGE_GENERATION_PROVIDERS="openai,google,openrouter,xai"OPENCLAW_LIVE_IMAGE_GENERATION_PROVIDERS="deepinfra"OPENCLAW_LIVE_IMAGE_GENERATION_MODELS="openai/gpt-image-2,google/gemini-3.1-flash-image-preview,openrouter/google/gemini-3.1-flash-image-preview,xai/grok-imagine-image"OPENCLAW_LIVE_IMAGE_GENERATION_CASES="google:flash-generate,google:pro-edit,openrouter:generate,xai:default-generate,xai:default-edit"
- Необов’язкова поведінка автентифікації:
OPENCLAW_LIVE_REQUIRE_PROFILE_KEYS=1, щоб примусово використовувати автентифікацію зі сховища профілів та ігнорувати перевизначення лише із середовища
Для поставленого шляху CLI додайте smoke infer після успішного проходження live-тесту
провайдера/runtime:
OPENCLAW_LIVE_TEST=1 OPENCLAW_LIVE_INFER_CLI_TEST=1 pnpm test:live -- test/image-generation.infer-cli.live.test.tsopenclaw infer image providers --jsonopenclaw infer image generate \ --model google/gemini-3.1-flash-image-preview \ --prompt "Minimal flat test image: one blue square on a white background, no text." \ --output ./openclaw-infer-image-smoke.png \ --jsonЦе охоплює розбір аргументів CLI, визначення конфігурації/типового агента, активацію вбудованого plugin, спільний runtime генерації зображень і live-запит до провайдера. Очікується, що залежності plugin наявні до завантаження runtime.
Music generation live
- Тест:
extensions/music-generation-providers.live.test.ts - Увімкнення:
OPENCLAW_LIVE_TEST=1 pnpm test:live -- extensions/music-generation-providers.live.test.ts - Оснастка:
pnpm test:live:media music - Обсяг:
- Перевіряє спільний вбудований шлях провайдера генерації музики
- Наразі охоплює Google і MiniMax
- Використовує вже експортовані змінні середовища провайдера перед пробами
- За замовчуванням використовує live/env API-ключі перед збереженими профілями автентифікації, щоб застарілі тестові ключі в
auth-profiles.jsonне маскували справжні облікові дані оболонки - Пропускає провайдерів без придатної автентифікації/профілю/моделі
- Запускає обидва заявлені режими runtime, коли вони доступні:
generateіз введенням лише підказкиedit, коли провайдер заявляєcapabilities.edit.enabled
- Поточне охоплення спільної лінії:
google:generate,editminimax:generatecomfy: окремий live-файл Comfy, не цей спільний sweep
- Необов’язкове звуження:
OPENCLAW_LIVE_MUSIC_GENERATION_PROVIDERS="google,minimax"OPENCLAW_LIVE_MUSIC_GENERATION_MODELS="google/lyria-3-clip-preview,minimax/music-2.6"
- Необов’язкова поведінка автентифікації:
OPENCLAW_LIVE_REQUIRE_PROFILE_KEYS=1, щоб примусово використовувати автентифікацію зі сховища профілів та ігнорувати перевизначення лише із середовища
Video generation live
- Тест:
extensions/video-generation-providers.live.test.ts - Увімкнення:
OPENCLAW_LIVE_TEST=1 pnpm test:live -- extensions/video-generation-providers.live.test.ts - Оснастка:
pnpm test:live:media video - Обсяг:
- Перевіряє спільний вбудований шлях провайдера генерації відео
- За замовчуванням використовує release-safe smoke шлях: не-FAL провайдери, один запит text-to-video на провайдера, односекундна підказка з омаром і ліміт операції для кожного провайдера з
OPENCLAW_LIVE_VIDEO_GENERATION_TIMEOUT_MS(180000за замовчуванням) - За замовчуванням пропускає FAL, оскільки затримка черги на боці провайдера може домінувати в часі релізу; передайте
--video-providers falабоOPENCLAW_LIVE_VIDEO_GENERATION_PROVIDERS="fal", щоб запустити його явно - Використовує вже експортовані змінні середовища провайдера перед пробами
- За замовчуванням використовує live/env API-ключі перед збереженими профілями автентифікації, щоб застарілі тестові ключі в
auth-profiles.jsonне маскували справжні облікові дані оболонки - Пропускає провайдерів без придатної автентифікації/профілю/моделі
- За замовчуванням запускає лише
generate - Установіть
OPENCLAW_LIVE_VIDEO_GENERATION_FULL_MODES=1, щоб також запускати заявлені режими перетворення, коли вони доступні:imageToVideo, коли провайдер заявляєcapabilities.imageToVideo.enabledі вибраний провайдер/модель приймає локальне введення зображення на основі буфера у спільному sweepvideoToVideo, коли провайдер заявляєcapabilities.videoToVideo.enabledі вибраний провайдер/модель приймає локальне введення відео на основі буфера у спільному sweep
- Поточні заявлені, але пропущені провайдери
imageToVideoу спільному sweep:vydra, оскільки вбудованийveo3є лише текстовим, а вбудованийklingпотребує віддаленої URL-адреси зображення
- Охоплення Vydra для конкретного провайдера:
OPENCLAW_LIVE_TEST=1 OPENCLAW_LIVE_VYDRA_VIDEO=1 pnpm test:live -- extensions/vydra/vydra.live.test.ts- цей файл запускає
veo3text-to-video плюс лініюkling, яка за замовчуванням використовує fixture з віддаленою URL-адресою зображення
- Поточне live-охоплення
videoToVideo:- лише
runway, коли вибрана модель —runway/gen4_aleph
- лише
- Поточні заявлені, але пропущені провайдери
videoToVideoу спільному sweep:alibaba,qwen,xai, оскільки ці шляхи наразі потребують віддаленихhttp(s)/ MP4 reference URLsgoogle, оскільки поточна спільна лінія Gemini/Veo використовує локальне введення на основі буфера, а цей шлях не приймається у спільному sweepopenai, оскільки поточній спільній лінії бракує гарантій доступу до редагування відео, специфічних для організації
- Необов’язкове звуження:
OPENCLAW_LIVE_VIDEO_GENERATION_PROVIDERS="deepinfra,google,openai,runway"OPENCLAW_LIVE_VIDEO_GENERATION_MODELS="google/veo-3.1-fast-generate-preview,openai/sora-2,runway/gen4_aleph"OPENCLAW_LIVE_VIDEO_GENERATION_SKIP_PROVIDERS="", щоб включити кожного провайдера в типовий sweep, зокрема FALOPENCLAW_LIVE_VIDEO_GENERATION_TIMEOUT_MS=60000, щоб зменшити ліміт операції кожного провайдера для агресивного smoke-запуску
- Необов’язкова поведінка автентифікації:
OPENCLAW_LIVE_REQUIRE_PROFILE_KEYS=1, щоб примусово використовувати автентифікацію зі сховища профілів та ігнорувати перевизначення лише із середовища
Media live harness
- Команда:
pnpm test:live:media - Призначення:
- Запускає спільні live-набори зображень, музики та відео через одну repo-native точку входу
- Використовує вже експортовані змінні середовища провайдера
- За замовчуванням автоматично звужує кожен набір до провайдерів, які наразі мають придатну автентифікацію
- Повторно використовує
scripts/test-live.mjs, тому поведінка Heartbeat і тихого режиму лишається узгодженою
- Приклади:
pnpm test:live:mediapnpm test:live:media image video --providers openai,google,minimaxpnpm test:live:media video --video-providers openai,runway --all-providerspnpm test:live:media music --quiet
Пов’язане
- Тестування - модульні, інтеграційні, QA та Docker-набори