从 Google AI Studio 迁移到 Vertex AI | Generative AI on Vertex AI | Google Cloud Documentation

跳至主要内容

文档技术领域

AI 和机器学习
应用开发
应用托管
计算
数据分析和流水线
数据库
分布式云、混合云和多云
生成式 AI
行业解决方案
网络
可观测性和监控
安全
Storage

跨产品工具

访问权限和资源管理
费用和用量管理
Google Cloud SDK、语言、框架和工具
基础架构即代码
迁移

相关网站

Google Cloud 首页
免费试用和免费层级
架构中心
博客
联系销售团队
Google Cloud 开发者中心
Google 开发者中心
Google Cloud Marketplace
Google Cloud Marketplace 文档
Google Cloud Skills Boost
Google Cloud Solution Center
Google Cloud 支持团队
Google Cloud Tech YouTube 频道

控制台

English
Deutsch
Español
Español – América Latina
Français
Indonesia
Italiano
Português
Português – Brasil
中文 – 简体
中文 – 繁體
日本語
한국어

登录

Generative AI on Vertex AI
Documentation

免费开始使用吧

指南 API 参考 Vertex AI Cookbook 提示库资源常见问题解答

文档
技术领域
- 更多
跨产品工具
- 更多
相关网站
- 更多
控制台

Discover
开始使用
选择模型
- Model Garden
- Model Garden 概览
- 使用 Model Garden 中的模型
- 测试模型功能
- 支持的模型
- Google 模型
- 概览
- Gemini
- Imagen
- Veo
- 模型版本
- 受管理模型
- 模型即服务 (MaaS) 概览
- 合作伙伴模型
  - 概览
  - Claude
    概览
    请求预测
    批量预测
    提示缓存
    统计 token 数量
    网页搜索
    模型详情
    Claude Sonnet 4.5
    Claude Opus 4.1
    Claude Haiku 4.5
    Claude Opus 4
    Claude Sonnet 4
    Claude 3.7 Sonnet
    Claude 3.5 Haiku
    Claude 3 Haiku
  - Mistral AI
    概览
    模型详情
    Mistral Medium 3
    Mistral OCR (25.05)
    Mistral Small 3.1 (25.03)
    Mistral Large (24.11)
    Codestral 2
    Codestral (25.01)
- 开放模型
  - 概览
  - 授予对开放模型的访问权限
  - 模型
  - DeepSeek
    概览
    DeepSeek-R1-0528
    DeepSeek-V3.1
  - OpenAI
    概览
    OpenAI gpt-oss-120b
    OpenAI gpt-oss-20b
  - Qwen
    概览
    Qwen 3 Next Instruct 80B
    Qwen 3 Next Thinking 80B
    Qwen 3 Coder
    Qwen 3 235B
  - 嵌入 (e5)
    多语言 E5 Small
    多语言 E5 Large
  - Llama
    概览
    请求预测
    模型详情
    Llama 4 Maverick
    Llama 4 Scout
    Llama 3.3
    Llama 3.2
    Llama 3.1 405b
    Llama 3.1 70b
    Llama 3.1 8b
  - 模型弃用 (MaaS)
  - API
  - 针对开放模型调用 MaaS API
  - 函数调用
  - 思考型
  - 结构化输出
  - 批量预测
- 自行部署的模型
- 概览
- 部署具有自定义权重的模型
- Google Gemma
- Llama
- 使用 Hugging Face 模型
- 适用于文本的 vLLM 和多模态 LLM 服务 (GPU) 的全面指南
- vLLM TPU
- Hex-LLM
- xDiT
- 教程：使用 SpotVM 和预留部署 Llama 3 模型
- Model Garden 笔记本
  - 教程：利用 Model Garden 中的高级功能优化模型性能
构建
- 代理
- 概览
- 智能体开发套件
- 代理引擎
  - 概览
  - 运行时
    快速入门
    设置环境
    
    开发代理
    概览
    智能体开发套件
    Agent2Agent
    LangChain
    LangGraph
    AG2
    LlamaIndex
    自定义
    部署代理
    
    使用代理
    概览
    智能体开发套件
    Agent2Agent
    LangChain
    LangGraph
    AG2
    LlamaIndex
    自定义
    
    管理已部署的代理
    概览
    访问权限控制
    跟踪
    日志记录
    监控
    双向流式传输
    使用 Private Service Connect 接口
  - 评估智能体
  - 会话数
    会话概览
    使用智能体开发套件管理会话
    使用 API 调用管理会话
  - 记忆库
    概览
    设置记忆库
    Agent Engine SDK 快速入门
    智能体开发套件快速入门
    生成记忆
    提取记忆内容
    问题排查
  - Example Store
    Example Store 概览
    存储区示例快速入门
    创建或重复使用存储区示例实例
    上传示例
    检索样本
  - 代码执行
    代码执行概览
    代码执行快速入门
  - 获取帮助
    排查环境设置问题
    排查代理开发问题
    排查代理部署问题
    排查使用代理时遇到的问题
    排查在管理已部署的智能体时遇到的问题
    排查代码执行问题
    获取支持
- Agent2Agent (A2A) Protocol
- 代理工具
- 提示设计
- 提示简介
- 提示策略
- 针对特定任务的提示指导
- 功能
- 安全
- 文本和代码生成
- 图片生成
  - Gemini
  - 使用 Gemini 生成图片
  - 使用 Gemini 修改图片
  - Imagen
  - Imagen 概览
  - 使用文本提示生成图片
  - 验证图片水印
  - 配置 Imagen 参数
    配置 Responsible AI 安全设置
    使用提示重写器
    设置文本提示语言
    配置宽高比
    设置输出分辨率
    使用反向提示排除内容
    生成确定性图片
  - 为零售和电子商务生成图片
    生成虚拟试穿图片
    重构产品图片场景
  - 修改图片
    概览
    使用修复功能将对象插入图片中
    使用修复功能从图片中移除对象
    使用扩绘功能扩展图片内容
    替换图片的背景
    使用个性化功能进行修改
    使用文本提示修改图片
  - 自定义图片
    主题自定义
    风格自定义
    受控自定义
    指示自定义
  - 放大图片
  - 提示和图片属性指南
  - 对文件进行 Base64 编码和解码
  - Responsible AI 和 Imagen 使用指南
  - 旧版功能
    迁移到 Imagen 3
    使用视觉标注获取图片说明
    使用 Visual Question Answering
    使用 Imagen 获取视频说明
- 视频生成
- 音乐生成
  - 使用 Lyria 生成音乐
  - Lyria 提示指南
- 媒体分析
- 落地
- 网址上下文
- 思考型
- 计算机使用
- Live API
- Embeddings
  - 概览
  - 文本嵌入
    获取文本嵌入
    选择嵌入任务类型
  - 获取多模态嵌入
  - 获取批量嵌入预测结果
- 翻译
- 根据文本生成语音
- 语音转写
- 开发工具
- 使用 AI 赋能的提示撰写工具
  - 概览
  - 优化提示
    概览
    零样本优化器
    数据驱动的优化器
  - 使用提示模板
- RAG 引擎
- 词元化器
  - 列出词元并进行计数
  - 使用 Count Tokens API
- 多模态数据集
- 使用 Vertex AI Search
- 模型调优
- 调优简介
- Gemini 模型
- 开放模型
- 嵌入模型
  - 调优文本嵌入模型
- Imagen 模型
  - 调整主题模型
  - 创建自定义样式模型
- 翻译模型
- 关于 LoRA 和 QLoRA 的调优建议
- 迁移
- 使用 OpenAI 库调用 Vertex AI 模型
评估
- 概览
- 教程：使用控制台执行评估
- 使用 Vertex AI SDK 中的生成式 AI 客户端执行评估
- 其他评估方法
- 使用 Vertex AI SDK 中的评估模块执行评估
- 运行 AutoSxS 流水线
- 运行基于计算的评估流水线
部署
- 概览
- 优化费用、延迟时间和性能
- 部署最佳做法
- 缓存重复使用的提示上下文
- 批量预测
- 预配的吞吐量
- 预配吞吐量概览
- 支持的模型
- 计算预配吞吐量要求