跳至主要内容
文档
技术领域
AI 和机器学习
应用开发
应用托管
计算
数据分析和流水线
数据库
分布式云、混合云和多云
生成式 AI
行业解决方案
网络
可观测性和监控
安全
Storage
跨产品工具
访问权限和资源管理
费用和用量管理
Google Cloud SDK、语言、框架和工具
基础架构即代码
迁移
相关网站
Google Cloud 首页
免费试用和免费层级
架构中心
博客
联系销售团队
Google Cloud 开发者中心
Google 开发者中心
Google Cloud Marketplace
Google Cloud Marketplace 文档
Google Cloud Skills Boost
Google Cloud Solution Center
Google Cloud 支持团队
Google Cloud Tech YouTube 频道
控制台
English
Deutsch
Español
Español – América Latina
Français
Indonesia
Italiano
Português
Português – Brasil
中文 – 简体
中文 – 繁體
日本語
한국어
登录
Generative AI on Vertex AI
Documentation
免费开始使用吧
指南
API 参考
Vertex AI Cookbook
提示库
资源
常见问题解答
文档
指南
API 参考
Vertex AI Cookbook
提示库
资源
常见问题解答
技术领域
更多
跨产品工具
更多
相关网站
更多
控制台
Discover
Generative AI on Vertex AI 概览
生成式 AI 初学者指南
术语库
开始使用
获取 API 密钥
配置应用默认凭证
API 快速入门
Vertex AI Studio 快速入门
从 Google AI Studio 迁移到 Vertex AI
将 Vertex AI Studio 提示部署为 Web 应用
Vertex AI Studio 功能
使用 Imagen 生成图片并验证其水印
Google GenAI 库
与 OpenAI 库的兼容性
快速模式下的 Vertex AI
概览
控制台教程
API 教程
选择模型
Model Garden
Model Garden 概览
使用 Model Garden 中的模型
测试模型功能
支持的模型
Google 模型
概览
Gemini
Gemini 2.5 Pro
Gemini 2.5 Flash
Gemini 2.5 Flash 图片
Gemini 2.5 Flash Live API
Gemini 2.5 Flash-Lite
Gemini 2.0 Flash
Gemini 2.0 Flash-Lite
Vertex AI 模型优化器
迁移到最新的 Gemini 模型
SDK
Imagen
Imagen 3.0 Generate 002
Imagen 3.0 Generate 001
Imagen 3.0 Fast Generate 001
Imagen 3.0 Capability 001
Imagen 4.0 Generate
Imagen 4.0 Fast Generate
Imagen 4.0 Ultra Generate
虚拟试穿预览版 (08-04)
Imagen 产品场景重构预览版 (06-30)
迁移到 Imagen 3
Veo
Veo 2
Veo 2 预览版
Veo 2 实验版
Veo 3
Veo 3 Fast
Veo 3 预览版
Veo 3 Fast 预览版
Veo 3.1 预览版
Veo 3.1 Fast 预览版
模型版本
受管理模型
模型即服务 (MaaS) 概览
合作伙伴模型
概览
Claude
概览
请求预测
批量预测
提示缓存
统计 token 数量
网页搜索
模型详情
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Claude 3.7 Sonnet
Claude 3.5 Haiku
Claude 3 Haiku
Mistral AI
概览
模型详情
Mistral Medium 3
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large (24.11)
Codestral 2
Codestral (25.01)
开放模型
概览
授予对开放模型的访问权限
模型
DeepSeek
概览
DeepSeek-R1-0528
DeepSeek-V3.1
OpenAI
概览
OpenAI gpt-oss-120b
OpenAI gpt-oss-20b
Qwen
概览
Qwen 3 Next Instruct 80B
Qwen 3 Next Thinking 80B
Qwen 3 Coder
Qwen 3 235B
嵌入 (e5)
多语言 E5 Small
多语言 E5 Large
Llama
概览
请求预测
模型详情
Llama 4 Maverick
Llama 4 Scout
Llama 3.3
Llama 3.2
Llama 3.1 405b
Llama 3.1 70b
Llama 3.1 8b
模型弃用 (MaaS)
API
针对开放模型调用 MaaS API
函数调用
思考型
结构化输出
批量预测
自行部署的模型
概览
部署具有自定义权重的模型
Google Gemma
使用 Gemma
教程:部署和推理 Gemma (GPU)
教程:部署和推理 Gemma (TPU)
Llama
使用 Hugging Face 模型
适用于文本的 vLLM 和多模态 LLM 服务 (GPU) 的全面指南
vLLM TPU
Hex-LLM
xDiT
教程:使用 SpotVM 和预留部署 Llama 3 模型
Model Garden 笔记本
教程:利用 Model Garden 中的高级功能优化模型性能
构建
代理
概览
智能体开发套件
概览
快速入门
部署到 Agent Engine
代理引擎
概览
运行时
快速入门
设置环境
开发代理
概览
智能体开发套件
Agent2Agent
LangChain
LangGraph
AG2
LlamaIndex
自定义
部署代理
使用代理
概览
智能体开发套件
Agent2Agent
LangChain
LangGraph
AG2
LlamaIndex
自定义
管理已部署的代理
概览
访问权限控制
跟踪
日志记录
监控
双向流式传输
使用 Private Service Connect 接口
评估智能体
会话数
会话概览
使用智能体开发套件管理会话
使用 API 调用管理会话
记忆库
概览
设置记忆库
Agent Engine SDK 快速入门
智能体开发套件快速入门
生成记忆
提取记忆内容
问题排查
Example Store
Example Store 概览
存储区示例快速入门
创建或重复使用存储区示例实例
上传示例
检索样本
代码执行
代码执行概览
代码执行快速入门
获取帮助
排查环境设置问题
排查代理开发问题
排查代理部署问题
排查使用代理时遇到的问题
排查在管理已部署的智能体时遇到的问题
排查代码执行问题
获取支持
Agent2Agent (A2A) Protocol
概览
A2A Python SDK
A2A JavaScript SDK
A2A Java SDK
A2A C#/.NET SDK
A2A 示例
代理工具
内置工具
Google Cloud 工具
Model Context Protocol (MCP) 工具
MCP Toolbox for Databases
生态系统工具
提示设计
提示简介
提示策略
概览
提供清晰而具体的说明
使用系统说明
添加少样本示例
添加上下文信息
设计提示结构
比较提示
指示模型解释其推理
分解复杂任务
使用参数值进行实验
提示迭代策略
针对特定任务的提示指导
设计多模态提示
设计聊天提示
设计医学文本提示
功能
安全
概览
Responsible AI
安全方面的系统说明
配置内容过滤条件
Gemini 在安全过滤和内容审核方面的应用
监控滥用行为
处理被屏蔽的回答
文本和代码生成
文本生成
系统指令
函数调用
结构化输出
内容生成参数
代码执行
医学文本
图片生成
Gemini
使用 Gemini 生成图片
使用 Gemini 修改图片
Imagen
Imagen 概览
使用文本提示生成图片
验证图片水印
配置 Imagen 参数
配置 Responsible AI 安全设置
使用提示重写器
设置文本提示语言
配置宽高比
设置输出分辨率
使用反向提示排除内容
生成确定性图片
为零售和电子商务生成图片
生成虚拟试穿图片
重构产品图片场景
修改图片
概览
使用修复功能将对象插入图片中
使用修复功能从图片中移除对象
使用扩绘功能扩展图片内容
替换图片的背景
使用个性化功能进行修改
使用文本提示修改图片
自定义图片
主题自定义
风格自定义
受控自定义
指示自定义
放大图片
提示和图片属性指南
对文件进行 Base64 编码和解码
Responsible AI 和 Imagen 使用指南
旧版功能
迁移到 Imagen 3
使用视觉标注获取图片说明
使用 Visual Question Answering
使用 Imagen 获取视频说明
视频生成
Veo 简介
根据文本提示生成 Veo 视频
根据图片生成 Veo 视频
使用视频的第一帧和最后一帧生成 Veo 视频
延长 Veo 视频
使用参考图片直接生成 Veo 视频
在 Veo 视频中插入对象
从 Veo 视频中移除对象
Veo 提示指南
关闭 Veo 的提示重写器
Responsible AI for Veo
音乐生成
使用 Lyria 生成音乐
Lyria 提示指南
媒体分析
图片理解
视频理解
音频理解
文档理解
边界框检测
落地
概览
使用 Google 搜索建立依据
依托 Google 地图进行接地
依托 Vertex AI Search 进行接地
通过搜索 API 接地
使用 RAG 对回答进行接地
与 Elasticsearch 进行接地
适用于企业的 Web 接地
网址上下文
思考型
计算机使用
Live API
Live API 概览
Live API 的最佳实践
互动式对话
内置工具
主动音频
Embeddings
概览
文本嵌入
获取文本嵌入
选择嵌入任务类型
获取多模态嵌入
获取批量嵌入预测结果
翻译
根据文本生成语音
语音转写
开发工具
使用 AI 赋能的提示撰写工具
概览
优化提示
概览
零样本优化器
数据驱动的优化器
使用提示模板
RAG 引擎
RAG 概览
RAG 快速入门
RAG Engine 结算
了解 RagManagedDb
数据注入
支持的模型
生成模型
嵌入模型
文档解析
支持的文档
微调 RAG 转换
使用 Document AI 布局解析器
使用 LLM 解析器
RAG 的向量数据库选项
向量数据库选择概览
将 RagManagedDb 与 RAG 搭配使用
将 Vertex AI Vector Search 与 RAG 搭配使用
将 Feature Store 与 RAG 搭配使用
将 Weaviate 与 RAG 搭配使用
将 Pinecone 与 RAG 搭配使用
将 Vertex AI Search 与 RAG 搭配使用
RAG 的重排
管理 RAG 语料库
将 CMEK 与 RAG 搭配使用
RAG 配额
在 Gemini Live API 中使用 RAG
词元化器
列出词元并进行计数
使用 Count Tokens API
多模态数据集
使用 Vertex AI Search
模型调优
调优简介
Gemini 模型
监督式微调简介
准备数据
使用监督式微调
使用调优检查点
支持的模态
文字微调
文档调整
图片调优
音频调谐
视频调优
调优函数调用
开放模型
嵌入模型
调优文本嵌入模型
Imagen 模型
调整主题模型
创建自定义样式模型
翻译模型
监督式微调简介
准备数据
使用监督式微调
关于 LoRA 和 QLoRA 的调优建议
迁移
使用 OpenAI 库调用 Vertex AI 模型
概览
身份验证
示例
评估
概览
教程:使用控制台执行评估
使用 Vertex AI SDK 中的生成式 AI 客户端执行评估
教程:使用 Vertex AI SDK 中的生成式 AI 客户端评估模型
定义评估指标
定义评估指标
基于评分准则的受管指标的详细信息
准备评估数据集
运行评估
查看和解读评估结果
其他评估方法
使用 Vertex AI SDK 中的评估模块执行评估
教程:使用 Vertex AI SDK 中的评估模块执行评估
定义评估指标
准备评估数据集
运行评估
解读评估结果
基于模型的指标的模板
评估智能体
评估评判模型
配置评判模型
运行 AutoSxS 流水线
运行基于计算的评估流水线
部署
概览
优化费用、延迟时间和性能
部署最佳做法
缓存重复使用的提示上下文
概览
创建上下文缓存
使用上下文缓存
获取上下文缓存信息
更新上下文缓存
删除上下文缓存
微调后的 Gemini 模型的上下文缓存
批量预测
概览
从 Cloud Storage 创建批量作业
通过 BigQuery 创建批量作业
预配的吞吐量
预配吞吐量概览
支持的模型
计算预配吞吐量要求