跳至主要内容
Google Cloud Documentation
文档 技术领域
  • AI 和机器学习
  • 应用开发
  • 应用托管
  • 计算
  • 数据分析和流水线
  • 数据库
  • 分布式云、混合云和多云
  • 生成式 AI
  • 行业解决方案
  • 网络
  • 可观测性和监控
  • 安全
  • Storage
跨产品工具
  • 访问权限和资源管理
  • 费用和用量管理
  • Google Cloud SDK、语言、框架和工具
  • 基础架构即代码
  • 迁移
相关网站
  • Google Cloud 首页
  • 免费试用和免费层级
  • 架构中心
  • 博客
  • 联系销售团队
  • Google Cloud 开发者中心
  • Google 开发者中心
  • Google Cloud Marketplace
  • Google Cloud Marketplace 文档
  • Google Cloud Skills Boost
  • Google Cloud Solution Center
  • Google Cloud 支持团队
  • Google Cloud Tech YouTube 频道
控制台
  • English
  • Deutsch
  • Español
  • Español – América Latina
  • Français
  • Indonesia
  • Italiano
  • Português
  • Português – Brasil
  • 中文 – 简体
  • 中文 – 繁體
  • 日本語
  • 한국어
登录
  • Generative AI on Vertex AI
  • Documentation
免费开始使用吧
指南 API 参考 Vertex AI Cookbook 提示库 资源 常见问题解答
Google Cloud Documentation
  • 文档
    • 指南
    • API 参考
    • Vertex AI Cookbook
    • 提示库
    • 资源
    • 常见问题解答
  • 技术领域
    • 更多
  • 跨产品工具
    • 更多
  • 相关网站
    • 更多
  • 控制台
  • Discover
    • Generative AI on Vertex AI 概览
    • 生成式 AI 初学者指南
    • 术语库
  • 开始使用
    • 获取 API 密钥
    • 配置应用默认凭证
    • API 快速入门
    • Vertex AI Studio 快速入门
    • 从 Google AI Studio 迁移到 Vertex AI
    • 将 Vertex AI Studio 提示部署为 Web 应用
    • Vertex AI Studio 功能
    • 使用 Imagen 生成图片并验证其水印
    • Google GenAI 库
    • 与 OpenAI 库的兼容性
    • 快速模式下的 Vertex AI
    • 概览
    • 控制台教程
    • API 教程
  • 选择模型
    • Model Garden
    • Model Garden 概览
    • 使用 Model Garden 中的模型
    • 测试模型功能
    • 支持的模型
    • Google 模型
    • 概览
    • Gemini
      • Gemini 2.5 Pro
      • Gemini 2.5 Flash
      • Gemini 2.5 Flash 图片
      • Gemini 2.5 Flash Live API
      • Gemini 2.5 Flash-Lite
      • Gemini 2.0 Flash
      • Gemini 2.0 Flash-Lite
      • Vertex AI 模型优化器
      • 迁移到最新的 Gemini 模型
      • SDK
    • Imagen
      • Imagen 3.0 Generate 002
      • Imagen 3.0 Generate 001
      • Imagen 3.0 Fast Generate 001
      • Imagen 3.0 Capability 001
      • Imagen 4.0 Generate
      • Imagen 4.0 Fast Generate
      • Imagen 4.0 Ultra Generate
      • 虚拟试穿预览版 (08-04)
      • Imagen 产品场景重构预览版 (06-30)
      • 迁移到 Imagen 3
    • Veo
      • Veo 2
      • Veo 2 预览版
      • Veo 2 实验版
      • Veo 3
      • Veo 3 Fast
      • Veo 3 预览版
      • Veo 3 Fast 预览版
      • Veo 3.1 预览版
      • Veo 3.1 Fast 预览版
    • 模型版本
    • 受管理模型
    • 模型即服务 (MaaS) 概览
    • 合作伙伴模型
      • 概览
      • Claude
        • 概览
        • 请求预测
        • 批量预测
        • 提示缓存
        • 统计 token 数量
        • 网页搜索
        • 模型详情
        • Claude Sonnet 4.5
        • Claude Opus 4.1
        • Claude Haiku 4.5
        • Claude Opus 4
        • Claude Sonnet 4
        • Claude 3.7 Sonnet
        • Claude 3.5 Haiku
        • Claude 3 Haiku
      • Mistral AI
        • 概览
        • 模型详情
        • Mistral Medium 3
        • Mistral OCR (25.05)
        • Mistral Small 3.1 (25.03)
        • Mistral Large (24.11)
        • Codestral 2
        • Codestral (25.01)
    • 开放模型
      • 概览
      • 授予对开放模型的访问权限
      • 模型
      • DeepSeek
        • 概览
        • DeepSeek-R1-0528
        • DeepSeek-V3.1
      • OpenAI
        • 概览
        • OpenAI gpt-oss-120b
        • OpenAI gpt-oss-20b
      • Qwen
        • 概览
        • Qwen 3 Next Instruct 80B
        • Qwen 3 Next Thinking 80B
        • Qwen 3 Coder
        • Qwen 3 235B
      • 嵌入 (e5)
        • 多语言 E5 Small
        • 多语言 E5 Large
      • Llama
        • 概览
        • 请求预测
        • 模型详情
        • Llama 4 Maverick
        • Llama 4 Scout
        • Llama 3.3
        • Llama 3.2
        • Llama 3.1 405b
        • Llama 3.1 70b
        • Llama 3.1 8b
      • 模型弃用 (MaaS)
      • API
      • 针对开放模型调用 MaaS API
      • 函数调用
      • 思考型
      • 结构化输出
      • 批量预测
    • 自行部署的模型
    • 概览
    • 部署具有自定义权重的模型
    • Google Gemma
      • 使用 Gemma
      • 教程:部署和推理 Gemma (GPU)
      • 教程:部署和推理 Gemma (TPU)
    • Llama
    • 使用 Hugging Face 模型
    • 适用于文本的 vLLM 和多模态 LLM 服务 (GPU) 的全面指南
    • vLLM TPU
    • Hex-LLM
    • xDiT
    • 教程:使用 SpotVM 和预留部署 Llama 3 模型
    • Model Garden 笔记本
      • 教程:利用 Model Garden 中的高级功能优化模型性能
  • 构建
    • 代理
    • 概览
    • 智能体开发套件
      • 概览
      • 快速入门
      • 部署到 Agent Engine
    • 代理引擎
      • 概览
      • 运行时
        • 快速入门
        • 设置环境
        • 开发代理
          • 概览
          • 智能体开发套件
          • Agent2Agent
          • LangChain
          • LangGraph
          • AG2
          • LlamaIndex
          • 自定义
        • 部署代理
        • 使用代理
          • 概览
          • 智能体开发套件
          • Agent2Agent
          • LangChain
          • LangGraph
          • AG2
          • LlamaIndex
          • 自定义
        • 管理已部署的代理
          • 概览
          • 访问权限控制
          • 跟踪
          • 日志记录
          • 监控
        • 双向流式传输
        • 使用 Private Service Connect 接口
      • 评估智能体
      • 会话数
        • 会话概览
        • 使用智能体开发套件管理会话
        • 使用 API 调用管理会话
      • 记忆库
        • 概览
        • 设置记忆库
        • Agent Engine SDK 快速入门
        • 智能体开发套件快速入门
        • 生成记忆
        • 提取记忆内容
        • 问题排查
      • Example Store
        • Example Store 概览
        • 存储区示例快速入门
        • 创建或重复使用存储区示例实例
        • 上传示例
        • 检索样本
      • 代码执行
        • 代码执行概览
        • 代码执行快速入门
      • 获取帮助
        • 排查环境设置问题
        • 排查代理开发问题
        • 排查代理部署问题
        • 排查使用代理时遇到的问题
        • 排查在管理已部署的智能体时遇到的问题
        • 排查代码执行问题
        • 获取支持
    • Agent2Agent (A2A) Protocol
      • 概览
      • A2A Python SDK
      • A2A JavaScript SDK
      • A2A Java SDK
      • A2A C#/.NET SDK
      • A2A 示例
    • 代理工具
      • 内置工具
      • Google Cloud 工具
      • Model Context Protocol (MCP) 工具
      • MCP Toolbox for Databases
      • 生态系统工具
    • 提示设计
    • 提示简介
    • 提示策略
      • 概览
      • 提供清晰而具体的说明
      • 使用系统说明
      • 添加少样本示例
      • 添加上下文信息
      • 设计提示结构
      • 比较提示
      • 指示模型解释其推理
      • 分解复杂任务
      • 使用参数值进行实验
      • 提示迭代策略
    • 针对特定任务的提示指导
      • 设计多模态提示
      • 设计聊天提示
      • 设计医学文本提示
    • 功能
    • 安全
      • 概览
      • Responsible AI
      • 安全方面的系统说明
      • 配置内容过滤条件
      • Gemini 在安全过滤和内容审核方面的应用
      • 监控滥用行为
      • 处理被屏蔽的回答
    • 文本和代码生成
      • 文本生成
      • 系统指令
      • 函数调用
      • 结构化输出
      • 内容生成参数
      • 代码执行
      • 医学文本
    • 图片生成
      • Gemini
      • 使用 Gemini 生成图片
      • 使用 Gemini 修改图片
      • Imagen
      • Imagen 概览
      • 使用文本提示生成图片
      • 验证图片水印
      • 配置 Imagen 参数
        • 配置 Responsible AI 安全设置
        • 使用提示重写器
        • 设置文本提示语言
        • 配置宽高比
        • 设置输出分辨率
        • 使用反向提示排除内容
        • 生成确定性图片
      • 为零售和电子商务生成图片
        • 生成虚拟试穿图片
        • 重构产品图片场景
      • 修改图片
        • 概览
        • 使用修复功能将对象插入图片中
        • 使用修复功能从图片中移除对象
        • 使用扩绘功能扩展图片内容
        • 替换图片的背景
        • 使用个性化功能进行修改
        • 使用文本提示修改图片
      • 自定义图片
        • 主题自定义
        • 风格自定义
        • 受控自定义
        • 指示自定义
      • 放大图片
      • 提示和图片属性指南
      • 对文件进行 Base64 编码和解码
      • Responsible AI 和 Imagen 使用指南
      • 旧版功能
        • 迁移到 Imagen 3
        • 使用视觉标注获取图片说明
        • 使用 Visual Question Answering
        • 使用 Imagen 获取视频说明
    • 视频生成
      • Veo 简介
      • 根据文本提示生成 Veo 视频
      • 根据图片生成 Veo 视频
      • 使用视频的第一帧和最后一帧生成 Veo 视频
      • 延长 Veo 视频
      • 使用参考图片直接生成 Veo 视频
      • 在 Veo 视频中插入对象
      • 从 Veo 视频中移除对象
      • Veo 提示指南
      • 关闭 Veo 的提示重写器
      • Responsible AI for Veo
    • 音乐生成
      • 使用 Lyria 生成音乐
      • Lyria 提示指南
    • 媒体分析
      • 图片理解
      • 视频理解
      • 音频理解
      • 文档理解
      • 边界框检测
    • 落地
      • 概览
      • 使用 Google 搜索建立依据
      • 依托 Google 地图进行接地
      • 依托 Vertex AI Search 进行接地
      • 通过搜索 API 接地
      • 使用 RAG 对回答进行接地
      • 与 Elasticsearch 进行接地
      • 适用于企业的 Web 接地
    • 网址上下文
    • 思考型
    • 计算机使用
    • Live API
      • Live API 概览
      • Live API 的最佳实践
      • 互动式对话
      • 内置工具
      • 主动音频
    • Embeddings
      • 概览
      • 文本嵌入
        • 获取文本嵌入
        • 选择嵌入任务类型
      • 获取多模态嵌入
      • 获取批量嵌入预测结果
    • 翻译
    • 根据文本生成语音
    • 语音转写
    • 开发工具
    • 使用 AI 赋能的提示撰写工具
      • 概览
      • 优化提示
        • 概览
        • 零样本优化器
        • 数据驱动的优化器
      • 使用提示模板
    • RAG 引擎
      • RAG 概览
      • RAG 快速入门
      • RAG Engine 结算
      • 了解 RagManagedDb
      • 数据注入
      • 支持的模型
        • 生成模型
        • 嵌入模型
      • 文档解析
        • 支持的文档
        • 微调 RAG 转换
        • 使用 Document AI 布局解析器
        • 使用 LLM 解析器
      • RAG 的向量数据库选项
        • 向量数据库选择概览
        • 将 RagManagedDb 与 RAG 搭配使用
        • 将 Vertex AI Vector Search 与 RAG 搭配使用
        • 将 Feature Store 与 RAG 搭配使用
        • 将 Weaviate 与 RAG 搭配使用
        • 将 Pinecone 与 RAG 搭配使用
      • 将 Vertex AI Search 与 RAG 搭配使用
      • RAG 的重排
      • 管理 RAG 语料库
      • 将 CMEK 与 RAG 搭配使用
      • RAG 配额
      • 在 Gemini Live API 中使用 RAG
    • 词元化器
      • 列出词元并进行计数
      • 使用 Count Tokens API
    • 多模态数据集
    • 使用 Vertex AI Search
    • 模型调优
    • 调优简介
    • Gemini 模型
      • 监督式微调简介
      • 准备数据
      • 使用监督式微调
      • 使用调优检查点
      • 支持的模态
        • 文字微调
        • 文档调整
        • 图片调优
        • 音频调谐
        • 视频调优
        • 调优函数调用
    • 开放模型
    • 嵌入模型
      • 调优文本嵌入模型
    • Imagen 模型
      • 调整主题模型
      • 创建自定义样式模型
    • 翻译模型
      • 监督式微调简介
      • 准备数据
      • 使用监督式微调
    • 关于 LoRA 和 QLoRA 的调优建议
    • 迁移
    • 使用 OpenAI 库调用 Vertex AI 模型
      • 概览
      • 身份验证
      • 示例
  • 评估
    • 概览
    • 教程:使用控制台执行评估
    • 使用 Vertex AI SDK 中的生成式 AI 客户端执行评估
      • 教程:使用 Vertex AI SDK 中的生成式 AI 客户端评估模型
      • 定义评估指标
        • 定义评估指标
        • 基于评分准则的受管指标的详细信息
      • 准备评估数据集
      • 运行评估
      • 查看和解读评估结果
    • 其他评估方法
    • 使用 Vertex AI SDK 中的评估模块执行评估
      • 教程:使用 Vertex AI SDK 中的评估模块执行评估
      • 定义评估指标
      • 准备评估数据集
      • 运行评估
      • 解读评估结果
      • 基于模型的指标的模板
      • 评估智能体
      • 评估评判模型
      • 配置评判模型
    • 运行 AutoSxS 流水线
    • 运行基于计算的评估流水线
  • 部署
    • 概览
    • 优化费用、延迟时间和性能
    • 部署最佳做法
    • 缓存重复使用的提示上下文
      • 概览
      • 创建上下文缓存
      • 使用上下文缓存
      • 获取上下文缓存信息
      • 更新上下文缓存
      • 删除上下文缓存
      • 微调后的 Gemini 模型的上下文缓存
    • 批量预测
      • 概览
      • 从 Cloud Storage 创建批量作业
      • 通过 BigQuery 创建批量作业
    • 预配的吞吐量
    • 预配吞吐量概览
    • 支持的模型
    • 计算预配吞吐量要求