内置工具
思考级别
它的作用
- 任意入站正文中的内联指令:
/t <level>、/think:<level>或/thinking <level>。 - 级别(别名):
off | minimal | low | medium | high | xhigh | adaptive | max- minimal → “think”
- low → “think hard”
- medium → “think harder”
- high → “ultrathink”(最大预算)
- xhigh → “ultrathink+”(GPT-5.2+ 和 Codex 模型,以及 Anthropic Claude Opus 4.7+ effort)
- adaptive → 由提供商管理的自适应思考(支持 Anthropic/Bedrock 上的 Claude 4.6、Anthropic Claude Opus 4.7+,以及 Google Gemini 动态思考)
- max → 提供商最大推理(Anthropic Claude Opus 4.7+;Ollama 会将其映射到其最高原生
thinkeffort) x-high、x_high、extra-high、extra high和extra_high映射到xhigh。highest映射到high。
- 提供商说明:
- 思考菜单和选择器由提供商配置文件驱动。提供商插件会为所选模型声明准确的级别集合,包括二元
on这类标签。 - 只有支持
adaptive、xhigh和max的提供商/模型配置文件才会展示它们。针对不支持级别的类型化指令会被拒绝,并返回该模型的有效选项。 - 已存储但不受支持的级别会按提供商配置文件等级重新映射。在非自适应模型上,
adaptive会回退到medium,而xhigh和max会回退到所选模型支持的最大非off级别。 - 未设置明确思考级别时,Anthropic Claude 4.6 模型默认使用
adaptive。 - Anthropic Claude Opus 4.8 和 Opus 4.7 会保持思考关闭,除非你明确设置思考级别。启用自适应思考后,Opus 4.8 的提供商自有 effort 默认值是
high。 - Anthropic Claude Opus 4.7+ 会将
/think xhigh映射到自适应思考加output_config.effort: "xhigh",因为/think是思考指令,而xhigh是 Opus effort 设置。 - Anthropic Claude Opus 4.7+ 也暴露
/think max;它会映射到同一个提供商自有最大 effort 路径。 - 直连 DeepSeek V4 模型暴露
/think xhigh|max;两者都映射到 DeepSeekreasoning_effort: "max",而较低的非 off 级别映射到high。 - 通过 OpenRouter 路由的 DeepSeek V4 模型暴露
/think xhigh,并发送 OpenRouter 支持的reasoning.effort值,而不是 DeepSeek 原生顶层reasoning_effort。较低的非 off 级别映射到high,已存储的max覆盖项会回退到xhigh。 - 支持思考的 Ollama 模型暴露
/think low|medium|high|max;max映射到原生think: "high",因为 Ollama 原生 API 接受low、medium和higheffort 字符串。 - OpenAI GPT 模型会通过模型特定的 Responses API effort 支持来映射
/think。只有目标模型支持时,/think off才会发送reasoning.effort: "none";否则 OpenClaw 会省略禁用推理载荷,而不是发送不受支持的值。 - 自定义 OpenAI 兼容目录条目可通过将
models.providers.<provider>.models[].compat.supportedReasoningEfforts设置为包含"xhigh",选择加入/think xhigh。这使用同一套兼容元数据来映射出站 OpenAI 推理 effort 载荷,因此菜单、会话校验、智能体 CLI 和llm-task会与传输行为保持一致。 - 过时的 OpenRouter Hunter Alpha 配置引用会跳过代理推理注入,因为这个已退役路由可能会通过推理字段返回最终答案文本。
- Google Gemini 会将
/think adaptive映射到 Gemini 提供商自有动态思考。Gemini 3 请求会省略固定的thinkingLevel,而 Gemini 2.5 请求会发送thinkingBudget: -1;固定级别仍会映射到该模型系列最接近的 GeminithinkingLevel或预算。 - Anthropic 兼容流式路径上的 MiniMax M2.x(
minimax/MiniMax-M2*)默认使用thinking: { type: "disabled" },除非你在模型参数或请求参数中明确设置思考。这避免 M2.x 非原生 Anthropic 流格式泄漏reasoning_content增量。MiniMax-M3(以及 M3.x)不受此限制:M3 会发出正确的 Anthropic 思考块,并在禁用思考时返回空内容,因此 OpenClaw 会让 M3 保持在提供商省略/自适应思考路径上。 - Z.AI(
zai/*)对大多数 GLM 模型是二元的(on/off)。GLM-5.2 是例外:它暴露/think off|low|high|max,将low和high映射到 Z.AIreasoning_effort: "high",并将max映射到reasoning_effort: "max"。 - Moonshot Kimi K2.7 Code(
moonshot/kimi-k2.7-code)始终会思考。它的配置文件只暴露on,并且 OpenClaw 会按 Moonshot 要求省略出站thinking字段。其他moonshot/*模型会将/think off映射到thinking: { type: "disabled" },并将任何非off级别映射到thinking: { type: "enabled" }。启用思考时,Moonshot 只接受tool_choiceauto|none;OpenClaw 会将不兼容的值规范化为auto。
- 思考菜单和选择器由提供商配置文件驱动。提供商插件会为所选模型声明准确的级别集合,包括二元
解析顺序
- 消息上的内联指令(仅应用于该消息)。
- 会话覆盖(通过发送仅包含指令的消息设置)。
- 按智能体默认值(配置中的
agents.list[].thinkingDefault)。 - 全局默认值(配置中的
agents.defaults.thinkingDefault)。 - 回退:可用时使用提供商声明的默认值;否则,具备推理能力的模型解析为
medium或该模型最接近的受支持非off级别,不具备推理能力的模型保持off。
设置会话默认值
- 发送一条仅包含指令的消息(允许空白),例如
/think:medium或/t high。 - 这会固定到当前会话(默认按发送者)。使用
/think default清除会话覆盖并继承已配置/提供商默认值;别名包括inherit、clear、reset和unpin。 /think off会存储一个明确的 off 覆盖项。它会禁用思考,直到你更改或清除会话覆盖。- 会发送确认回复(“思考级别已设置为 high。”/“思考已禁用。”)。如果级别无效(例如
/thinking big),命令会被拒绝并返回提示,会话状态保持不变。 - 发送不带参数的
/think(或/think:)可查看当前思考级别。
按智能体应用
- 嵌入式 OpenClaw:已解析级别会传递给进程内 OpenClaw 智能体运行时。
- Claude CLI 后端:使用
claude-cli时,非 off 级别会作为--effort传递给 Claude Code;参见 CLI 后端。
快速模式(/fast)
- 级别:
auto|on|off|default。 - 仅包含指令的消息会切换会话快速模式覆盖,并回复
Fast mode set to auto.、Fast mode enabled.或Fast mode disabled.。使用/fast default清除会话覆盖并继承已配置默认值;别名包括inherit、clear、reset和unpin。 - 发送不带模式的
/fast(或/fast status)可查看当前生效的快速模式状态。 - OpenClaw 按以下顺序解析快速模式:
- 内联/仅指令
/fast auto|on|off覆盖(/fast default清除此层) - 会话覆盖
- 按智能体默认值(
agents.list[].fastModeDefault) - 按模型配置:
agents.defaults.models["<provider>/<model>"].params.fastMode - 回退:
off
- 内联/仅指令
auto会让会话/配置模式保持为 auto,但会独立解析每次新模型调用。在自动截止时间前启动的调用会启用快速模式;之后的重试、回退、工具结果或续写调用会在快速模式禁用状态下启动。截止时间默认是 60 秒;在活动模型上设置agents.defaults.models["<provider>/<model>"].params.fastAutoOnSeconds可更改它。- 对于
openai/*,快速模式会通过在受支持的 Responses 请求上发送service_tier=priority映射到 OpenAI 优先处理。 - 对于 Codex 支持的
openai/*/openai-codex/*模型,快速模式会在 Codex Responses 上发送相同的service_tier=priority标志。原生 Codex 应用服务器轮次只会在turn/start或线程开始/恢复时收到该层级,因此auto无法为已经运行的应用服务器轮次重新分层;它会应用于 OpenClaw 启动的下一个模型轮次。 - 对于直连公开
anthropic/*请求,包括发送到api.anthropic.com的 OAuth 认证流量,快速模式会映射到 Anthropic 服务层级:/fast on设置service_tier=auto,/fast off设置service_tier=standard_only。 - 对于 Anthropic 兼容路径上的
minimax/*,/fast on(或params.fastMode: true)会将MiniMax-M2.7重写为MiniMax-M2.7-highspeed。 - 同时设置时,显式 Anthropic
serviceTier/service_tier模型参数会覆盖快速模式默认值。OpenClaw 仍会跳过非 Anthropic 代理基础 URL 的 Anthropic 服务层级注入。 /status会在快速模式启用时显示Fast,在配置模式为 auto 时显示Fast:auto。
详细指令(/verbose 或 /v)
- 级别:
on(最小)|full|off(默认)。 - 仅包含指令的消息会切换会话详细模式,并回复
Verbose logging enabled./Verbose logging disabled.;无效级别会返回提示且不更改状态。 /verbose off会存储一个明确的会话覆盖;可通过 Sessions UI 选择inherit来清除它。- 已授权的外部渠道发送者可以持久化会话详细模式覆盖。内部 Gateway 网关/webchat 客户端需要
operator.admin才能持久化它。 - 内联指令仅影响该消息;否则应用会话/全局默认值。
- 发送不带参数的
/verbose(或/verbose:)可查看当前详细级别。 - 详细模式开启时,会发出结构化工具结果的智能体会将每次工具调用作为自己的仅元数据消息发回;可用时以前缀
<emoji> <tool-name>: <arg>开头。这些工具摘要会在每个工具启动时立即发送(单独气泡),而不是作为流式增量发送。 - 工具失败摘要在普通模式下仍可见,但原始错误详情后缀会被隐藏,除非详细级别为
full。 - 当详细级别为
full时,工具输出也会在完成后转发(单独气泡,并截断到安全长度)。如果你在运行进行中切换/verbose on|full|off,后续工具气泡会遵循新设置。 agents.defaults.toolProgressDetail控制/verbose工具摘要和进度草稿工具行的形态。使用"explain"(默认)可获得紧凑的人类可读标签,例如🛠️ Exec: checking JS syntax;如果你还希望附加原始命令/详情用于调试,请使用"raw"。按智能体agents.list[].toolProgressDetail会覆盖默认值。explain:🛠️ Exec: check JS syntax for /tmp/app.jsraw:🛠️ Exec: check JS syntax for /tmp/app.js, node --check /tmp/app.js
插件跟踪指令(/trace)
- 级别:
on|off(默认)。 - 仅包含指令的消息会切换会话插件跟踪输出,并回复
Plugin trace enabled./Plugin trace disabled.。 - 内联指令仅影响该消息;否则应用会话/全局默认值。
- 发送不带参数的
/trace(或/trace:)可查看当前跟踪级别。 /trace比/verbose更窄:它只暴露插件自有的跟踪/调试行,例如 Active Memory 调试摘要。- 跟踪行可能出现在
/status中,也可能在普通助手回复后作为后续诊断消息出现。
推理可见性(/reasoning)
- 级别:
on|off|stream。 - 仅包含指令的消息会切换是否在回复中显示思考块。
- 启用后,推理会作为单独消息发送,并以
Thinking为前缀。 stream:当活动渠道支持推理预览时,在回复生成期间流式传输推理,然后发送不含推理的最终答案。- 别名:
/reason。 - 发送不带参数的
/reasoning(或/reasoning:)可查看当前推理级别。 - 解析顺序:内联指令,然后是会话覆盖,然后是按智能体默认值(
agents.list[].reasoningDefault),然后是全局默认值(agents.defaults.reasoningDefault),最后是回退(off)。
异常的本地模型推理标签会被保守处理。闭合的 <think>...</think> 块在普通回复中保持隐藏,已经可见文本之后未闭合的推理内容也会被隐藏。如果回复完全包在一个未闭合的起始标签中,否则会作为空文本发送,OpenClaw 会移除异常的起始标签并发送剩余文本。
相关
- 提升权限模式文档位于 提升权限模式。
Heartbeats
- Heartbeat 探测正文是已配置的 Heartbeat 提示词(默认:
Read HEARTBEAT.md if it exists (workspace context). Follow it strictly. Do not infer or repeat old tasks from prior chats. If nothing needs attention, reply HEARTBEAT_OK.)。Heartbeat 消息中的内联指令会照常应用(但应避免通过 Heartbeat 更改会话默认值)。 - Heartbeat 发送默认只发送最终载荷。若还要发送单独的
Thinking消息(可用时),请设置agents.defaults.heartbeat.includeReasoning: true或按 Agent 设置agents.list[].heartbeat.includeReasoning: true。
Web 聊天 UI
- Web 聊天思考选择器会在页面加载时镜像入站会话存储/配置中的会话已存级别。
- 选择另一个级别会立即通过
sessions.patch写入会话覆盖;它不会等到下一次发送,也不是一次性的thinkingOnce覆盖。 - 第一个选项始终是清除覆盖的选项。它显示
Inherited: <resolved level>,包括继承的思考被禁用时显示的Inherited: Off。 - 显式选择器选项使用其直接级别标签,同时在存在提供商标签时保留提供商标签(例如提供商标记的
max选项显示为Maximum)。 - 选择器使用 Gateway 网关会话行/默认值返回的
thinkingLevels,并将thinkingOptions保留为旧版标签列表。浏览器 UI 不保留自己的提供商正则列表;插件拥有特定模型的级别集合。 /think:<level>仍然可用,并会更新同一个已存会话级别,因此聊天指令和选择器会保持同步。
提供商配置文件
- 提供商插件可以公开
resolveThinkingProfile(ctx)来定义模型支持的级别和默认值。 - 代理 Claude 模型的提供商插件应复用
openclaw/plugin-sdk/provider-model-shared中的resolveClaudeThinkingProfile(modelId),以便直接 Anthropic 和代理目录保持一致。 - 每个配置文件级别都有一个已存的规范
id(off、minimal、low、medium、high、xhigh、adaptive或max),也可以包含一个显示label。二元提供商使用{ id: "low", label: "on" }。 - 可用时,配置文件钩子会接收合并后的目录事实,包括
reasoning、compat.thinkingFormat和compat.supportedReasoningEfforts。只有当已配置的请求契约支持匹配载荷时,才使用这些事实公开二元或自定义配置文件。 - 需要验证显式思考覆盖的工具插件应使用
api.runtime.agent.resolveThinkingPolicy({ provider, model })加上api.runtime.agent.normalizeThinkingLevel(...);它们不应保留自己的提供商/模型级别列表。 - 能访问已配置自定义模型元数据的工具插件可以将
catalog传入resolveThinkingPolicy,这样compat.supportedReasoningEfforts选择启用项就会反映在插件侧验证中。 - 已发布的旧版钩子(
supportsXHighThinking、isBinaryThinking和resolveDefaultThinkingLevel)仍作为兼容性适配器保留,但新的自定义级别集合应使用resolveThinkingProfile。 - Gateway 网关行/默认值公开
thinkingLevels、thinkingOptions和thinkingDefault,以便 ACP/聊天客户端渲染与运行时验证所用相同的配置文件 id 和标签。
Was this useful?