Testing
테스트: 라이브 스위트
빠른 시작, QA 실행기, 단위/통합 스위트, Docker 플로는 테스트를 참조하세요. 이 페이지에서는 라이브(네트워크에 접속하는) 테스트 스위트, 즉 모델 매트릭스, CLI 백엔드, ACP, 미디어 제공자 라이브 테스트와 자격 증명 처리를 다룹니다.
라이브: 로컬 스모크 명령
임시 라이브 검사를 실행하기 전에 필요한 제공자 키를 프로세스 환경으로 내보내세요.
안전한 미디어 스모크:
pnpm openclaw infer tts convert --local --json \ --text "OpenClaw live smoke." \ --output /tmp/openclaw-live-smoke.mp3안전한 음성 통화 준비 상태 스모크:
pnpm openclaw voicecall setup --jsonpnpm openclaw voicecall smoke --to "+15555550123"voicecall smoke는 --yes도 함께 있을 때를 제외하면 드라이런입니다. 실제 알림 전화를
의도적으로 걸고 싶을 때만 --yes를 사용하세요. Twilio, Telnyx, Plivo의 경우
성공적인 준비 상태 검사에는 공개 Webhook URL이 필요하며, 로컬 전용
loopback/비공개 폴백은 의도적으로 거부됩니다.
라이브: Android 노드 기능 스윕
- 테스트:
src/gateway/android-node.capabilities.live.test.ts - 스크립트:
pnpm android:test:integration - 목표: 연결된 Android 노드가 현재 알리는 모든 명령을 호출하고 명령 계약 동작을 검증합니다.
- 범위:
- 사전 조건이 필요한 수동 설정(이 스위트는 앱을 설치/실행/페어링하지 않습니다).
- 선택한 Android 노드에 대한 명령별 Gateway
node.invoke검증.
- 필요한 사전 설정:
- Android 앱이 이미 Gateway에 연결되고 페어링되어 있어야 합니다.
- 앱을 포그라운드에 유지해야 합니다.
- 통과할 것으로 예상하는 기능에 대한 권한/캡처 동의가 부여되어 있어야 합니다.
- 선택적 대상 재정의:
OPENCLAW_ANDROID_NODE_ID또는OPENCLAW_ANDROID_NODE_NAME.OPENCLAW_ANDROID_GATEWAY_URL/OPENCLAW_ANDROID_GATEWAY_TOKEN/OPENCLAW_ANDROID_GATEWAY_PASSWORD.
- 전체 Android 설정 세부 정보: Android 앱
라이브: 모델 스모크(프로필 키)
라이브 테스트는 실패를 분리할 수 있도록 두 계층으로 나뉩니다.
- "직접 모델"은 해당 키로 제공자/모델이 아예 응답할 수 있는지 알려줍니다.
- "Gateway 스모크"는 전체 Gateway+에이전트 파이프라인이 해당 모델에서 작동하는지 알려줍니다(세션, 기록, 도구, 샌드박스 정책 등).
계층 1: 직접 모델 완성(Gateway 없음)
- 테스트:
src/agents/models.profiles.live.test.ts - 목표:
- 발견된 모델 열거
getApiKeyForModel을 사용해 자격 증명이 있는 모델 선택- 모델별 작은 완성 실행(필요한 경우 대상 회귀 테스트 포함)
- 활성화 방법:
pnpm test:live(또는 Vitest를 직접 호출하는 경우OPENCLAW_LIVE_TEST=1)
- 이 스위트를 실제로 실행하려면
OPENCLAW_LIVE_MODELS=modern,small또는all(modern의 별칭)을 설정하세요. 그렇지 않으면pnpm test:live가 Gateway 스모크에 집중되도록 건너뜁니다. - 모델 선택 방법:
OPENCLAW_LIVE_MODELS=modern으로 최신 허용 목록 실행(Opus/Sonnet 4.6+, GPT-5.2 + Codex, Gemini 3, DeepSeek V4, GLM 5.1, MiniMax M3, Grok 4.3)OPENCLAW_LIVE_MODELS=small로 제한된 소형 모델 허용 목록 실행(Qwen 8B/9B 로컬 호환 경로, Ollama Gemma, OpenRouter Qwen/GLM, Z.AI GLM)OPENCLAW_LIVE_MODELS=all은 최신 허용 목록의 별칭입니다.- 또는
OPENCLAW_LIVE_MODELS="openai/gpt-5.5,anthropic/claude-opus-4-6,..."(쉼표 허용 목록) - 로컬 Ollama 소형 모델 실행은 기본적으로
http://127.0.0.1:11434를 사용합니다. LAN, 사용자 지정 또는 Ollama Cloud 엔드포인트에만OPENCLAW_LIVE_OLLAMA_BASE_URL을 설정하세요. - modern/all 및 small 스윕은 기본적으로 선별된 상한을 사용합니다. 전체 선택 프로필 스윕에는
OPENCLAW_LIVE_MAX_MODELS=0을 설정하거나 더 작은 상한에는 양수를 설정하세요. - 전체 스윕은 전체 직접 모델 테스트 제한 시간에
OPENCLAW_LIVE_TEST_TIMEOUT_MS를 사용합니다. 기본값: 60분. - 직접 모델 프로브는 기본적으로 20방향 병렬 처리로 실행됩니다. 재정의하려면
OPENCLAW_LIVE_MODEL_CONCURRENCY를 설정하세요.
- 제공자 선택 방법:
OPENCLAW_LIVE_PROVIDERS="google,google-antigravity,google-gemini-cli"(쉼표 허용 목록)
- 키 출처:
- 기본값: 프로필 저장소 및 env 폴백
- 프로필 저장소만 강제하려면
OPENCLAW_LIVE_REQUIRE_PROFILE_KEYS=1을 설정하세요.
- 존재 이유:
- "제공자 API가 고장 났음 / 키가 유효하지 않음"을 "Gateway 에이전트 파이프라인이 고장 났음"과 분리합니다.
- 작고 격리된 회귀 테스트를 포함합니다(예: OpenAI Responses/Codex Responses 추론 리플레이 + 도구 호출 플로).
계층 2: Gateway + 개발 에이전트 스모크("@openclaw"가 실제로 하는 일)
- 테스트:
src/gateway/gateway-models.profiles.live.test.ts - 목표:
- 프로세스 내부 Gateway 시작
agent:dev:*세션 생성/패치(실행별 모델 재정의)- 키가 있는 모델을 반복하고 다음을 검증:
- "의미 있는" 응답(도구 없음)
- 실제 도구 호출 동작(읽기 프로브)
- 선택적 추가 도구 프로브(exec+read 프로브)
- OpenAI 회귀 경로(도구 호출 전용 → 후속)가 계속 동작함
- 프로브 세부 정보(실패를 빠르게 설명할 수 있도록):
read프로브: 테스트가 작업 영역에 nonce 파일을 쓰고 에이전트에게 이를read한 뒤 nonce를 다시 에코하도록 요청합니다.exec+read프로브: 테스트가 에이전트에게exec로 nonce를 임시 파일에 쓰고, 그런 다음 이를 다시read하도록 요청합니다.- 이미지 프로브: 테스트가 생성된 PNG(cat + 무작위 코드)를 첨부하고 모델이
cat <CODE>를 반환하기를 기대합니다. - 구현 참조:
src/gateway/gateway-models.profiles.live.test.ts및test/helpers/live-image-probe.ts.
- 활성화 방법:
pnpm test:live(또는 Vitest를 직접 호출하는 경우OPENCLAW_LIVE_TEST=1)
- 모델 선택 방법:
- 기본값: 최신 허용 목록(Opus/Sonnet 4.6+, GPT-5.2 + Codex, Gemini 3, DeepSeek V4, GLM 4.7, MiniMax M3, Grok 4.3)
OPENCLAW_LIVE_GATEWAY_MODELS=small로 동일한 제한된 소형 모델 허용 목록을 전체 Gateway+에이전트 파이프라인에서 실행OPENCLAW_LIVE_GATEWAY_MODELS=all은 최신 허용 목록의 별칭입니다.- 또는 좁히려면
OPENCLAW_LIVE_GATEWAY_MODELS="provider/model"(또는 쉼표 목록)을 설정하세요. - modern/all 및 small Gateway 스윕은 기본적으로 선별된 상한을 사용합니다. 전체 선택 스윕에는
OPENCLAW_LIVE_GATEWAY_MAX_MODELS=0을 설정하거나 더 작은 상한에는 양수를 설정하세요.
- 제공자 선택 방법("OpenRouter 전부" 방지):
OPENCLAW_LIVE_GATEWAY_PROVIDERS="google,google-antigravity,google-gemini-cli,openai,anthropic,zai,minimax"(쉼표 허용 목록)
- 도구 + 이미지 프로브는 이 라이브 테스트에서 항상 켜져 있습니다.
read프로브 +exec+read프로브(도구 스트레스)- 이미지 프로브는 모델이 이미지 입력 지원을 알릴 때 실행됩니다.
- 플로(상위 수준):
- 테스트가 "CAT" + 무작위 코드가 있는 작은 PNG를 생성합니다(
test/helpers/live-image-probe.ts). agentattachments: [{ mimeType: "image/png", content: "<base64>" }]를 통해 전송합니다.- Gateway가 첨부 파일을
images[]로 파싱합니다(src/gateway/server-methods/agent.ts+src/gateway/chat-attachments.ts). - 임베디드 에이전트가 멀티모달 사용자 메시지를 모델에 전달합니다.
- 어설션: 응답에
cat+ 코드가 포함됨(OCR 허용치: 사소한 실수 허용)
- 테스트가 "CAT" + 무작위 코드가 있는 작은 PNG를 생성합니다(
라이브: CLI 백엔드 스모크(Claude, Gemini 또는 기타 로컬 CLI)
- 테스트:
src/gateway/gateway-cli-backend.live.test.ts - 목표: 기본 구성을 건드리지 않고 로컬 CLI 백엔드를 사용해 Gateway + 에이전트 파이프라인을 검증합니다.
- 백엔드별 스모크 기본값은 소유 extension의
cli-backend.ts정의에 있습니다. - 활성화:
pnpm test:live(또는 Vitest를 직접 호출하는 경우OPENCLAW_LIVE_TEST=1)OPENCLAW_LIVE_CLI_BACKEND=1
- 기본값:
- 기본 제공자/모델:
claude-cli/claude-sonnet-4-6 - 명령/인자/이미지 동작은 소유 CLI 백엔드 Plugin 메타데이터에서 가져옵니다.
- 기본 제공자/모델:
- 재정의(선택 사항):
OPENCLAW_LIVE_CLI_BACKEND_MODEL="claude-cli/claude-sonnet-4-6"OPENCLAW_LIVE_CLI_BACKEND_COMMAND="/full/path/to/claude"OPENCLAW_LIVE_CLI_BACKEND_ARGS='["-p","--output-format","json"]'- 실제 이미지 첨부 파일을 보내려면
OPENCLAW_LIVE_CLI_BACKEND_IMAGE_PROBE=1을 설정합니다(경로는 프롬프트에 주입됩니다). Docker 레시피는 명시적으로 요청하지 않는 한 기본적으로 이를 끕니다. - 프롬프트 주입 대신 이미지 파일 경로를 CLI 인자로 전달하려면
OPENCLAW_LIVE_CLI_BACKEND_IMAGE_ARG="--image"를 설정합니다. IMAGE_ARG가 설정된 경우 이미지 인자가 전달되는 방식을 제어하려면OPENCLAW_LIVE_CLI_BACKEND_IMAGE_MODE="repeat"(또는"list")를 설정합니다.- 두 번째 턴을 보내고 재개 플로를 검증하려면
OPENCLAW_LIVE_CLI_BACKEND_RESUME_PROBE=1을 설정합니다. - 선택한 모델이 전환 대상을 지원할 때 Claude Sonnet -> Opus 동일 세션 연속성 프로브를 선택하려면
OPENCLAW_LIVE_CLI_BACKEND_MODEL_SWITCH_PROBE=1을 설정합니다. Docker 레시피는 집계 안정성을 위해 기본적으로 이를 끕니다. - MCP/도구 loopback 프로브를 선택하려면
OPENCLAW_LIVE_CLI_BACKEND_MCP_PROBE=1을 설정합니다. Docker 레시피는 명시적으로 요청하지 않는 한 기본적으로 이를 끕니다.
예:
OPENCLAW_LIVE_CLI_BACKEND=1 \ OPENCLAW_LIVE_CLI_BACKEND_MODEL="claude-cli/claude-sonnet-4-6" \ pnpm test:live src/gateway/gateway-cli-backend.live.test.ts저렴한 Gemini MCP 구성 스모크:
OPENCLAW_LIVE_TEST=1 \ pnpm test:live src/agents/cli-runner/bundle-mcp.gemini.live.test.ts이는 Gemini에게 응답 생성을 요청하지 않습니다. OpenClaw가 Gemini에 제공하는 것과 동일한 시스템
설정을 쓴 다음 gemini --debug mcp list를 실행해 저장된
transport: "streamable-http" 서버가 Gemini의 HTTP MCP 형태로 정규화되고
로컬 streamable-HTTP MCP 서버에 연결할 수 있음을 증명합니다.
Docker 레시피:
pnpm test:docker:live-cli-backend단일 제공자 Docker 레시피:
pnpm test:docker:live-cli-backend:claudepnpm test:docker:live-cli-backend:claude-subscriptionpnpm test:docker:live-cli-backend:gemini참고:
- Docker 실행기는
scripts/test-live-cli-backend-docker.sh에 있습니다. - repo Docker 이미지 안에서 루트가 아닌
node사용자로 라이브 CLI 백엔드 스모크를 실행합니다. - 소유 extension에서 CLI 스모크 메타데이터를 확인한 다음, 일치하는 Linux CLI 패키지(
@anthropic-ai/claude-code또는@google/gemini-cli)를OPENCLAW_DOCKER_CLI_TOOLS_DIR의 캐시된 쓰기 가능한 prefix(기본값:~/.cache/openclaw/docker-cli-tools)에 설치합니다. pnpm test:docker:live-cli-backend:claude-subscription에는claudeAiOauth.subscriptionType이 있는~/.claude/.credentials.json또는claude setup-token의CLAUDE_CODE_OAUTH_TOKEN을 통한 이식 가능한 Claude Code 구독 OAuth가 필요합니다. 먼저 Docker에서 직접claude -p를 증명한 다음, Anthropic API 키 env vars를 보존하지 않고 Gateway CLI 백엔드 턴 두 개를 실행합니다. 이 구독 lane은 로그인한 구독의 사용 한도를 소비하고 Anthropic이 OpenClaw 릴리스 없이 Claude Agent SDK /claude -p청구 및 속도 제한 동작을 변경할 수 있기 때문에 기본적으로 Claude MCP/도구 및 이미지 프로브를 비활성화합니다.- 라이브 CLI 백엔드 스모크는 이제 Claude와 Gemini에 대해 동일한 엔드투엔드 플로를 실행합니다. 텍스트 턴, 이미지 분류 턴, 그다음 Gateway CLI를 통해 검증되는 MCP
cron도구 호출입니다. - Claude의 기본 스모크는 세션을 Sonnet에서 Opus로 패치하고 재개된 세션이 이전 메모를 여전히 기억하는지도 검증합니다.
라이브: APNs HTTP/2 프록시 도달 가능성
- 테스트:
src/infra/push-apns-http2.live.test.ts - 목표: 로컬 HTTP CONNECT 프록시를 통해 Apple의 sandbox APNs 엔드포인트로 터널링하고, APNs HTTP/2 검증 요청을 보낸 뒤, Apple의 실제
403 InvalidProviderToken응답이 프록시 경로를 통해 반환되는지 검증합니다. - 활성화:
OPENCLAW_LIVE_TEST=1 OPENCLAW_LIVE_APNS_REACHABILITY=1 pnpm test:live src/infra/push-apns-http2.live.test.ts
- 선택적 제한 시간:
OPENCLAW_LIVE_APNS_TIMEOUT_MS=30000
라이브: ACP 바인드 스모크(/acp spawn ... --bind here)
- 테스트:
src/gateway/gateway-acp-bind.live.test.ts - 목표: 라이브 ACP 에이전트로 실제 ACP 대화 바인드 흐름을 검증합니다:
/acp spawn <agent> --bind here전송- 합성 메시지 채널 대화를 제자리에서 바인드
- 같은 대화에 일반 후속 메시지 전송
- 후속 메시지가 바인드된 ACP 세션 transcript에 도착하는지 확인
- 활성화:
pnpm test:live src/gateway/gateway-acp-bind.live.test.tsOPENCLAW_LIVE_ACP_BIND=1
- 기본값:
- Docker의 ACP 에이전트:
claude,codex,gemini - 직접
pnpm test:live ...실행 시 ACP 에이전트:claude - 합성 채널: Slack DM 스타일 대화 컨텍스트
- ACP 백엔드:
acpx
- Docker의 ACP 에이전트:
- 재정의:
OPENCLAW_LIVE_ACP_BIND_AGENT=claudeOPENCLAW_LIVE_ACP_BIND_AGENT=codexOPENCLAW_LIVE_ACP_BIND_AGENT=droidOPENCLAW_LIVE_ACP_BIND_AGENT=geminiOPENCLAW_LIVE_ACP_BIND_AGENT=opencodeOPENCLAW_LIVE_ACP_BIND_AGENTS=claude,codex,geminiOPENCLAW_LIVE_ACP_BIND_AGENT_COMMAND='npx -y @agentclientprotocol/claude-agent-acp@<version>'OPENCLAW_LIVE_ACP_BIND_CODEX_MODEL=gpt-5.5OPENCLAW_LIVE_ACP_BIND_OPENCODE_MODEL=opencode/kimi-k2.6OPENCLAW_LIVE_ACP_BIND_REQUIRE_TRANSCRIPT=1OPENCLAW_LIVE_ACP_BIND_REQUIRE_CRON=1OPENCLAW_LIVE_ACP_BIND_PARENT_MODEL=openai/gpt-5.5
- 참고:
- 이 lane은 admin 전용 합성 originating-route 필드와 함께 Gateway
chat.send표면을 사용하므로, 테스트가 외부 전달을 가장하지 않고 메시지 채널 컨텍스트를 연결할 수 있습니다. OPENCLAW_LIVE_ACP_BIND_AGENT_COMMAND가 설정되지 않은 경우, 테스트는 선택한 ACP harness 에이전트에 대해 임베드된acpxPlugin의 기본 에이전트 레지스트리를 사용합니다.- 외부 ACP harness가 bind/image 증명이 통과한 뒤 MCP 호출을 취소할 수 있으므로, 바인드된 세션 Cron MCP 생성은 기본적으로 최선 노력 방식입니다. 이 바인드 후 Cron 프로브를 엄격하게 만들려면
OPENCLAW_LIVE_ACP_BIND_REQUIRE_CRON=1을 설정하세요.
- 이 lane은 admin 전용 합성 originating-route 필드와 함께 Gateway
예:
OPENCLAW_LIVE_ACP_BIND=1 \ OPENCLAW_LIVE_ACP_BIND_AGENT=claude \ pnpm test:live src/gateway/gateway-acp-bind.live.test.tsDocker 레시피:
pnpm test:docker:live-acp-bind단일 에이전트 Docker 레시피:
pnpm test:docker:live-acp-bind:claudepnpm test:docker:live-acp-bind:codexpnpm test:docker:live-acp-bind:droidpnpm test:docker:live-acp-bind:geminipnpm test:docker:live-acp-bind:opencodeDocker 참고:
- Docker runner는
scripts/test-live-acp-bind-docker.sh에 있습니다. - 기본적으로 ACP bind smoke를 집계 라이브 CLI 에이전트에 대해 순서대로 실행합니다:
claude,codex, 그다음gemini. - 매트릭스를 좁히려면
OPENCLAW_LIVE_ACP_BIND_AGENTS=claude,OPENCLAW_LIVE_ACP_BIND_AGENTS=codex,OPENCLAW_LIVE_ACP_BIND_AGENTS=droid,OPENCLAW_LIVE_ACP_BIND_AGENTS=gemini또는OPENCLAW_LIVE_ACP_BIND_AGENTS=opencode를 사용하세요. - 일치하는 CLI 인증 자료를 컨테이너에 스테이징한 다음, 없으면 요청한 라이브 CLI(
@anthropic-ai/claude-code,@openai/codex,https://app.factory.ai/cli를 통한 Factory Droid,@google/gemini-cli또는opencode-ai)를 설치합니다. ACP 백엔드 자체는 공식acpxPlugin의 임베드된acpx/runtime패키지입니다. - Droid Docker 변형은 설정을 위해
~/.factory를 스테이징하고,FACTORY_API_KEY를 전달하며, 로컬 Factory OAuth/keyring 인증은 컨테이너로 이식할 수 없으므로 해당 API 키가 필요합니다. ACPX의 기본droid exec --output-format acp레지스트리 항목을 사용합니다. - OpenCode Docker 변형은 엄격한 단일 에이전트 회귀 lane입니다.
OPENCLAW_LIVE_ACP_BIND_OPENCODE_MODEL(기본값opencode/kimi-k2.6)에서 임시OPENCODE_CONFIG_CONTENT기본 모델을 작성하며,pnpm test:docker:live-acp-bind:opencode는 일반적인 바인드 후 건너뛰기를 허용하지 않고 바인드된 assistant transcript를 요구합니다. - 직접
acpxCLI 호출은 Gateway 외부 동작을 비교하기 위한 수동/우회 경로일 뿐입니다. Docker ACP bind smoke는 OpenClaw의 임베드된acpx런타임 백엔드를 실행합니다.
라이브: Codex 앱 서버 harness smoke
- 목표: 일반 Gateway
agent메서드를 통해 Plugin 소유 Codex harness를 검증합니다:- 번들된
codexPlugin 로드 - 기본적으로 OpenAI 에이전트 턴을 Codex로 라우팅하는
openai/gpt-5.5선택 - Codex harness가 선택된 상태에서 첫 번째 Gateway 에이전트 턴을
openai/gpt-5.5로 전송 - 같은 OpenClaw 세션에 두 번째 턴을 보내고 app-server 스레드가 재개될 수 있는지 확인
- 같은 Gateway 명령
경로를 통해
/codex status및/codex models실행 - 선택적으로 Guardian이 검토하는 escalated shell 프로브 두 개 실행: 승인되어야 하는 무해한 명령 하나와 거부되어 에이전트가 되물어야 하는 fake-secret 업로드 하나
- 번들된
- 테스트:
src/gateway/gateway-codex-harness.live.test.ts - 활성화:
OPENCLAW_LIVE_CODEX_HARNESS=1 - 기본 모델:
openai/gpt-5.5 - 선택적 이미지 프로브:
OPENCLAW_LIVE_CODEX_HARNESS_IMAGE_PROBE=1 - 선택적 MCP/tool 프로브:
OPENCLAW_LIVE_CODEX_HARNESS_MCP_PROBE=1 - 선택적 Guardian 프로브:
OPENCLAW_LIVE_CODEX_HARNESS_GUARDIAN_PROBE=1 - smoke는 provider/model
agentRuntime.id: "codex"를 강제하므로, 고장 난 Codex harness가 조용히 OpenClaw로 fallback되어 통과할 수 없습니다. - 인증: 로컬 Codex 구독 로그인에서 가져온 Codex app-server 인증. Docker
smoke는 해당되는 경우 Codex가 아닌 프로브용
OPENAI_API_KEY도 제공할 수 있으며, 선택적으로 복사된~/.codex/auth.json및~/.codex/config.toml도 사용할 수 있습니다.
로컬 레시피:
OPENCLAW_LIVE_CODEX_HARNESS=1 \ OPENCLAW_LIVE_CODEX_HARNESS_IMAGE_PROBE=1 \ OPENCLAW_LIVE_CODEX_HARNESS_MCP_PROBE=1 \ OPENCLAW_LIVE_CODEX_HARNESS_GUARDIAN_PROBE=1 \ OPENCLAW_LIVE_CODEX_HARNESS_MODEL=openai/gpt-5.5 \ pnpm test:live -- src/gateway/gateway-codex-harness.live.test.tsDocker 레시피:
pnpm test:docker:live-codex-harnessDocker 참고:
- Docker runner는
scripts/test-live-codex-harness-docker.sh에 있습니다. OPENAI_API_KEY를 전달하고, 있으면 Codex CLI 인증 파일을 복사하며, 쓰기 가능한 마운트된 npm prefix에@openai/codex를 설치하고, 소스 트리를 스테이징한 다음 Codex-harness 라이브 테스트만 실행합니다.- Docker는 기본적으로 이미지, MCP/tool, Guardian 프로브를 활성화합니다. 더 좁은 디버그
실행이 필요하면
OPENCLAW_LIVE_CODEX_HARNESS_IMAGE_PROBE=0또는OPENCLAW_LIVE_CODEX_HARNESS_MCP_PROBE=0또는OPENCLAW_LIVE_CODEX_HARNESS_GUARDIAN_PROBE=0을 설정하세요. - Docker는 동일한 명시적 Codex 런타임 구성을 사용하므로, 레거시 alias나 OpenClaw fallback이 Codex harness 회귀를 숨길 수 없습니다.
권장 라이브 레시피
좁고 명시적인 allowlist가 가장 빠르고 flaky가 가장 적습니다:
-
단일 모델, 직접 실행(Gateway 없음):
OPENCLAW_LIVE_MODELS="openai/gpt-5.5" pnpm test:live src/agents/models.profiles.live.test.ts
-
소형 모델 직접 profile:
OPENCLAW_LIVE_MODELS=small pnpm test:live src/agents/models.profiles.live.test.ts
-
소형 모델 Gateway profile:
OPENCLAW_LIVE_GATEWAY_MODELS=small pnpm test:live src/gateway/gateway-models.profiles.live.test.ts
-
Ollama Cloud API smoke:
OPENCLAW_LIVE_TEST=1 OPENCLAW_LIVE_OLLAMA=1 OPENCLAW_LIVE_OLLAMA_BASE_URL=https://ollama.com OPENCLAW_LIVE_OLLAMA_MODEL=glm-5.1:cloud OPENCLAW_LIVE_OLLAMA_WEB_SEARCH=0 pnpm test:live -- extensions/ollama/ollama.live.test.ts
-
단일 모델, Gateway smoke:
OPENCLAW_LIVE_GATEWAY_MODELS="openai/gpt-5.5" pnpm test:live src/gateway/gateway-models.profiles.live.test.ts
-
여러 provider에 걸친 tool calling:
OPENCLAW_LIVE_GATEWAY_MODELS="openai/gpt-5.5,anthropic/claude-opus-4-6,google/gemini-3-flash-preview,deepseek/deepseek-v4-flash,zai/glm-5.1,minimax/MiniMax-M3" pnpm test:live src/gateway/gateway-models.profiles.live.test.ts
-
Z.AI Coding Plan GLM-5.2 직접 smoke:
ZAI_CODING_LIVE_TEST=1 pnpm test:live src/agents/zai.live.test.ts
-
Google 집중(Gemini API 키 + Antigravity):
- Gemini(API 키):
OPENCLAW_LIVE_GATEWAY_MODELS="google/gemini-3-flash-preview" pnpm test:live src/gateway/gateway-models.profiles.live.test.ts - Antigravity(OAuth):
OPENCLAW_LIVE_GATEWAY_MODELS="google-antigravity/claude-opus-4-6-thinking,google-antigravity/gemini-3-pro-high" pnpm test:live src/gateway/gateway-models.profiles.live.test.ts
- Gemini(API 키):
-
Google adaptive thinking smoke:
- Gemini 3 동적 기본값:
pnpm openclaw qa manual --provider-mode live-frontier --model google/gemini-3.1-pro-preview --alt-model google/gemini-3.1-pro-preview --message '/think adaptive Reply exactly: GEMINI_ADAPTIVE_OK' --timeout-ms 180000 - Gemini 2.5 동적 budget:
pnpm openclaw qa manual --provider-mode live-frontier --model google/gemini-2.5-flash --alt-model google/gemini-2.5-flash --message '/think adaptive Reply exactly: GEMINI25_ADAPTIVE_OK' --timeout-ms 180000
- Gemini 3 동적 기본값:
참고:
google/...는 Gemini API(API 키)를 사용합니다.google-antigravity/...는 Antigravity OAuth 브리지(Cloud Code Assist 스타일 에이전트 엔드포인트)를 사용합니다.google-gemini-cli/...는 머신의 로컬 Gemini CLI를 사용합니다(별도 인증 + 도구 특성).- Gemini API와 Gemini CLI:
- API: OpenClaw가 HTTP를 통해 Google의 호스팅 Gemini API를 호출합니다(API 키 / profile 인증). 이것이 대부분의 사용자가 "Gemini"라고 할 때 의미하는 것입니다.
- CLI: OpenClaw가 로컬
gemini바이너리를 shell out합니다. 자체 인증이 있으며 다르게 동작할 수 있습니다(스트리밍/tool 지원/버전 불일치).
라이브: 모델 매트릭스(커버 범위)
고정된 "CI 모델 목록"은 없지만(라이브는 opt-in), 키가 있는 개발 머신에서 정기적으로 커버하기를 권장하는 모델은 다음과 같습니다.
최신 smoke 세트(tool calling + 이미지)
계속 동작해야 한다고 기대하는 "공통 모델" 실행입니다:
- OpenAI(비 Codex):
openai/gpt-5.5 - OpenAI ChatGPT/Codex OAuth:
openai/gpt-5.5 - Anthropic:
anthropic/claude-opus-4-6(또는anthropic/claude-sonnet-4-6) - Google(Gemini API):
google/gemini-3.1-pro-preview및google/gemini-3-flash-preview(이전 Gemini 2.x 모델은 피하세요) - Google(Antigravity):
google-antigravity/claude-opus-4-6-thinking및google-antigravity/gemini-3-flash - DeepSeek:
deepseek/deepseek-v4-flash및deepseek/deepseek-v4-pro - Z.AI(GLM):
zai/glm-5.1(일반 API) 또는zai/glm-5.2(Coding Plan) - MiniMax:
minimax/MiniMax-M3
tool + 이미지로 Gateway smoke 실행:
OPENCLAW_LIVE_GATEWAY_MODELS="openai/gpt-5.5,anthropic/claude-opus-4-6,google/gemini-3.1-pro-preview,google/gemini-3-flash-preview,google-antigravity/claude-opus-4-6-thinking,google-antigravity/gemini-3-flash,deepseek/deepseek-v4-flash,zai/glm-5.1,minimax/MiniMax-M3" pnpm test:live src/gateway/gateway-models.profiles.live.test.ts
기준선: tool calling(Read + 선택적 Exec)
provider 계열별로 최소 하나를 선택하세요:
- OpenAI:
openai/gpt-5.5 - Anthropic:
anthropic/claude-opus-4-6(또는anthropic/claude-sonnet-4-6) - Google:
google/gemini-3-flash-preview(또는google/gemini-3.1-pro-preview) - DeepSeek:
deepseek/deepseek-v4-flash - Z.AI(GLM):
zai/glm-5.1(일반 API) 또는zai/glm-5.2(Coding Plan) - MiniMax:
minimax/MiniMax-M3
선택적 추가 커버리지(있으면 좋음):
- xAI:
xai/grok-4.3(또는 사용 가능한 최신) - Mistral:
mistral/…(활성화한 "tools" 지원 모델 하나 선택) - Cerebras:
cerebras/…(접근 권한이 있는 경우) - LM Studio:
lmstudio/…(로컬; tool calling은 API 모드에 따라 다름)
Vision: 이미지 전송(첨부 파일 → multimodal 메시지)
이미지 프로브를 실행하려면 OPENCLAW_LIVE_GATEWAY_MODELS에 이미지 지원 모델을 최소 하나 포함하세요(Claude/Gemini/OpenAI vision 지원 변형 등).
Aggregator / 대체 Gateway
키가 활성화되어 있으면 다음을 통한 테스트도 지원합니다:
- OpenRouter:
openrouter/...(수백 개의 모델; tool+image 지원 후보를 찾으려면openclaw models scan사용) - OpenCode: Zen용
opencode/...및 Go용opencode-go/...(OPENCODE_API_KEY/OPENCODE_ZEN_API_KEY를 통한 인증)
라이브 매트릭스에 포함할 수 있는 추가 provider(자격 증명/구성이 있는 경우):
- 내장:
openai,anthropic,google,google-vertex,google-antigravity,google-gemini-cli,zai,openrouter,opencode,opencode-go,xai,groq,cerebras,mistral,github-copilot models.providers를 통해 사용(사용자 지정 엔드포인트):minimax(클라우드/API), 그리고 OpenAI/Anthropic 호환 프록시(LM Studio, vLLM, LiteLLM 등)
자격 증명(절대 커밋하지 마세요)
라이브 테스트는 CLI와 같은 방식으로 자격 증명을 발견합니다. 실제 영향은 다음과 같습니다.
-
CLI가 작동하면 라이브 테스트도 같은 키를 찾아야 합니다.
-
라이브 테스트가 "자격 증명 없음"이라고 하면
openclaw models list/ 모델 선택을 디버그하는 것과 같은 방식으로 디버그하세요. -
에이전트별 인증 프로필:
~/.openclaw/agents/<agentId>/agent/auth-profiles.json(라이브 테스트에서 "프로필 키"가 의미하는 항목) -
설정:
~/.openclaw/openclaw.json(또는OPENCLAW_CONFIG_PATH) -
레거시 상태 디렉터리:
~/.openclaw/credentials/(있으면 스테이징된 라이브 홈으로 복사되지만, 기본 프로필 키 저장소는 아님) -
라이브 로컬 실행은 기본적으로 활성 설정, 에이전트별
auth-profiles.json파일, 레거시credentials/, 지원되는 외부 CLI 인증 디렉터리를 임시 테스트 홈으로 복사합니다. 스테이징된 라이브 홈은workspace/와sandboxes/를 건너뛰며,agents.*.workspace/agentDir경로 재정의는 제거되어 프로브가 실제 호스트 작업 공간에 접근하지 않도록 합니다.
환경 키에 의존하려면 로컬 테스트 전에 키를 내보내거나, 아래의
Docker 러너를 명시적인 OPENCLAW_PROFILE_FILE과 함께 사용하세요.
Deepgram 라이브(오디오 전사)
- 테스트:
extensions/deepgram/audio.live.test.ts - 활성화:
DEEPGRAM_API_KEY=... DEEPGRAM_LIVE_TEST=1 pnpm test:live extensions/deepgram/audio.live.test.ts
BytePlus 코딩 계획 라이브
- 테스트:
extensions/byteplus/live.test.ts - 활성화:
BYTEPLUS_API_KEY=... BYTEPLUS_LIVE_TEST=1 pnpm test:live extensions/byteplus/live.test.ts - 선택적 모델 재정의:
BYTEPLUS_CODING_MODEL=ark-code-latest
ComfyUI 워크플로 미디어 라이브
- 테스트:
extensions/comfy/comfy.live.test.ts - 활성화:
OPENCLAW_LIVE_TEST=1 COMFY_LIVE_TEST=1 pnpm test:live -- extensions/comfy/comfy.live.test.ts - 범위:
- 번들 comfy 이미지, 동영상,
music_generate경로를 실행합니다 plugins.entries.comfy.config.<capability>가 설정되어 있지 않으면 각 기능을 건너뜁니다- comfy 워크플로 제출, 폴링, 다운로드 또는 Plugin 등록을 변경한 뒤에 유용합니다
- 번들 comfy 이미지, 동영상,
이미지 생성 라이브
- 테스트:
test/image-generation.runtime.live.test.ts - 명령:
pnpm test:live test/image-generation.runtime.live.test.ts - 하네스:
pnpm test:live:media image - 범위:
- 등록된 모든 이미지 생성 제공자 Plugin을 열거합니다
- 프로브 전에 이미 내보낸 제공자 환경 변수를 사용합니다
- 기본적으로 저장된 인증 프로필보다 라이브/환경 API 키를 우선 사용하므로
auth-profiles.json의 오래된 테스트 키가 실제 셸 자격 증명을 가리지 않습니다 - 사용 가능한 인증/프로필/모델이 없는 제공자는 건너뜁니다
- 각 설정된 제공자를 공유 이미지 생성 런타임을 통해 실행합니다:
<provider>:generate- 제공자가 편집 지원을 선언한 경우
<provider>:edit
- 현재 포함된 번들 제공자:
deepinfrafalgoogleminimaxopenaiopenroutervydraxai
- 선택적 축소:
OPENCLAW_LIVE_IMAGE_GENERATION_PROVIDERS="openai,google,openrouter,xai"OPENCLAW_LIVE_IMAGE_GENERATION_PROVIDERS="deepinfra"OPENCLAW_LIVE_IMAGE_GENERATION_MODELS="openai/gpt-image-2,google/gemini-3.1-flash-image-preview,openrouter/google/gemini-3.1-flash-image-preview,xai/grok-imagine-image"OPENCLAW_LIVE_IMAGE_GENERATION_CASES="google:flash-generate,google:pro-edit,openrouter:generate,xai:default-generate,xai:default-edit"
- 선택적 인증 동작:
OPENCLAW_LIVE_REQUIRE_PROFILE_KEYS=1로 프로필 저장소 인증을 강제하고 환경 전용 재정의를 무시합니다
출시된 CLI 경로의 경우 제공자/런타임 라이브 테스트가 통과한 뒤 infer 스모크를 추가하세요:
OPENCLAW_LIVE_TEST=1 OPENCLAW_LIVE_INFER_CLI_TEST=1 pnpm test:live -- test/image-generation.infer-cli.live.test.tsopenclaw infer image providers --jsonopenclaw infer image generate \ --model google/gemini-3.1-flash-image-preview \ --prompt "Minimal flat test image: one blue square on a white background, no text." \ --output ./openclaw-infer-image-smoke.png \ --json이는 CLI 인수 파싱, 설정/기본 에이전트 해석, 번들 Plugin 활성화, 공유 이미지 생성 런타임, 라이브 제공자 요청을 포함합니다. Plugin 종속성은 런타임 로드 전에 있어야 합니다.
음악 생성 라이브
- 테스트:
extensions/music-generation-providers.live.test.ts - 활성화:
OPENCLAW_LIVE_TEST=1 pnpm test:live -- extensions/music-generation-providers.live.test.ts - 하네스:
pnpm test:live:media music - 범위:
- 공유 번들 음악 생성 제공자 경로를 실행합니다
- 현재 Google과 MiniMax를 포함합니다
- 프로브 전에 이미 내보낸 제공자 환경 변수를 사용합니다
- 기본적으로 저장된 인증 프로필보다 라이브/환경 API 키를 우선 사용하므로
auth-profiles.json의 오래된 테스트 키가 실제 셸 자격 증명을 가리지 않습니다 - 사용 가능한 인증/프로필/모델이 없는 제공자는 건너뜁니다
- 사용 가능한 경우 선언된 두 런타임 모드를 모두 실행합니다:
- 프롬프트 전용 입력으로
generate - 제공자가
capabilities.edit.enabled를 선언한 경우edit
- 프롬프트 전용 입력으로
- 현재 공유 레인 범위:
google:generate,editminimax:generatecomfy: 이 공유 스윕이 아니라 별도의 Comfy 라이브 파일
- 선택적 축소:
OPENCLAW_LIVE_MUSIC_GENERATION_PROVIDERS="google,minimax"OPENCLAW_LIVE_MUSIC_GENERATION_MODELS="google/lyria-3-clip-preview,minimax/music-2.6"
- 선택적 인증 동작:
OPENCLAW_LIVE_REQUIRE_PROFILE_KEYS=1로 프로필 저장소 인증을 강제하고 환경 전용 재정의를 무시합니다
동영상 생성 라이브
- 테스트:
extensions/video-generation-providers.live.test.ts - 활성화:
OPENCLAW_LIVE_TEST=1 pnpm test:live -- extensions/video-generation-providers.live.test.ts - 하네스:
pnpm test:live:media video - 범위:
- 공유 번들 동영상 생성 제공자 경로를 실행합니다
- 기본값은 출시 안전 스모크 경로입니다: FAL이 아닌 제공자, 제공자당 텍스트-동영상 요청 하나, 1초짜리 랍스터 프롬프트, 그리고
OPENCLAW_LIVE_VIDEO_GENERATION_TIMEOUT_MS의 제공자별 작업 상한(기본값180000) - 제공자 측 큐 지연 시간이 출시 시간을 지배할 수 있으므로 기본적으로 FAL은 건너뜁니다. 명시적으로 실행하려면
--video-providers fal또는OPENCLAW_LIVE_VIDEO_GENERATION_PROVIDERS="fal"을 전달하세요 - 프로브 전에 이미 내보낸 제공자 환경 변수를 사용합니다
- 기본적으로 저장된 인증 프로필보다 라이브/환경 API 키를 우선 사용하므로
auth-profiles.json의 오래된 테스트 키가 실제 셸 자격 증명을 가리지 않습니다 - 사용 가능한 인증/프로필/모델이 없는 제공자는 건너뜁니다
- 기본적으로
generate만 실행합니다 - 사용 가능한 경우 선언된 변환 모드도 실행하려면
OPENCLAW_LIVE_VIDEO_GENERATION_FULL_MODES=1을 설정하세요:- 제공자가
capabilities.imageToVideo.enabled를 선언하고 선택한 제공자/모델이 공유 스윕에서 버퍼 기반 로컬 이미지 입력을 허용하는 경우imageToVideo - 제공자가
capabilities.videoToVideo.enabled를 선언하고 선택한 제공자/모델이 공유 스윕에서 버퍼 기반 로컬 동영상 입력을 허용하는 경우videoToVideo
- 제공자가
- 공유 스윕에서 현재 선언되었지만 건너뛰는
imageToVideo제공자:vydra: 번들veo3가 텍스트 전용이고 번들kling에는 원격 이미지 URL이 필요하기 때문입니다
- 제공자별 Vydra 범위:
OPENCLAW_LIVE_TEST=1 OPENCLAW_LIVE_VYDRA_VIDEO=1 pnpm test:live -- extensions/vydra/vydra.live.test.ts- 해당 파일은
veo3텍스트-동영상과 기본적으로 원격 이미지 URL 픽스처를 사용하는kling레인을 실행합니다
- 현재
videoToVideo라이브 범위:- 선택한 모델이
runway/gen4_aleph인 경우에만runway
- 선택한 모델이
- 공유 스윕에서 현재 선언되었지만 건너뛰는
videoToVideo제공자:alibaba,qwen,xai: 해당 경로에는 현재 원격http(s)/ MP4 참조 URL이 필요하기 때문입니다google: 현재 공유 Gemini/Veo 레인이 로컬 버퍼 기반 입력을 사용하며 해당 경로가 공유 스윕에서 허용되지 않기 때문입니다openai: 현재 공유 레인에는 조직별 동영상 편집 액세스 보장이 없기 때문입니다
- 선택적 축소:
OPENCLAW_LIVE_VIDEO_GENERATION_PROVIDERS="deepinfra,google,openai,runway"OPENCLAW_LIVE_VIDEO_GENERATION_MODELS="google/veo-3.1-fast-generate-preview,openai/sora-2,runway/gen4_aleph"- 기본 스윕에 FAL을 포함한 모든 제공자를 포함하려면
OPENCLAW_LIVE_VIDEO_GENERATION_SKIP_PROVIDERS="" - 공격적인 스모크 실행을 위해 각 제공자 작업 상한을 줄이려면
OPENCLAW_LIVE_VIDEO_GENERATION_TIMEOUT_MS=60000
- 선택적 인증 동작:
OPENCLAW_LIVE_REQUIRE_PROFILE_KEYS=1로 프로필 저장소 인증을 강제하고 환경 전용 재정의를 무시합니다
미디어 라이브 하네스
- 명령:
pnpm test:live:media - 목적:
- 공유 이미지, 음악, 동영상 라이브 스위트를 하나의 리포지토리 네이티브 진입점으로 실행합니다
- 이미 내보낸 제공자 환경 변수를 사용합니다
- 기본적으로 현재 사용 가능한 인증이 있는 제공자로 각 스위트를 자동 축소합니다
scripts/test-live.mjs를 재사용하므로 Heartbeat와 조용한 모드 동작이 일관되게 유지됩니다
- 예:
pnpm test:live:mediapnpm test:live:media image video --providers openai,google,minimaxpnpm test:live:media video --video-providers openai,runway --all-providerspnpm test:live:media music --quiet
관련 항목
- 테스트 - 단위, 통합, QA, Docker 스위트