Passa ai contenuti principali
Documentazione
Aree tecnologiche
AI e ML
Sviluppo di applicazioni
Hosting di applicazioni
Computing
Analisi dei dati e pipeline
Database
Distribuito, ibrido e multi-cloud
AI generativa
Soluzioni di settore
Networking
Osservabilità e monitoraggio
Sicurezza
Storage
Strumenti per più prodotti
Gestione di accessi e risorse
Gestione di costi e utilizzo
Google Cloud SDK, linguaggi, framework e strumenti
Infrastructure as Code (IaC)
Migrazione
Siti correlati
Home page di Google Cloud
Prova gratuita e livello gratuito
Architecture Center
Blog
Contatta il team di vendita
Developer Center di Google Cloud
Google Developer Center
Google Cloud Marketplace
Documentazione di Google Cloud Marketplace
Google Cloud Skills Boost
Google Cloud Solution Center
Assistenza Google Cloud
Canale YouTube di Google Cloud Tech
Console
English
Deutsch
Español
Español – América Latina
Français
Indonesia
Italiano
Português
Português – Brasil
中文 – 简体
日本語
한국어
Accedi
Generative AI on Vertex AI
Documentation
Inizia gratuitamente
Guide
Riferimento API
Vertex AI Cookbook
Galleria dei prompt
Risorse
Domande frequenti
Documentazione
Guide
Riferimento API
Vertex AI Cookbook
Galleria dei prompt
Risorse
Domande frequenti
Aree tecnologiche
Altro
Strumenti per più prodotti
Altro
Siti correlati
Altro
Console
Scopri
Panoramica dell'IA generativa su Vertex AI
Guida per principianti all'IA generativa
Glossario
Per iniziare
Ottieni una chiave API
Configurare le credenziali predefinite dell'applicazione
Guida rapida alle API
Guida rapida di Vertex AI Studio
Migra da Google AI Studio a Vertex AI
Esegui il deployment del prompt di Vertex AI Studio come applicazione web
Funzionalità di Vertex AI Studio
Generare un'immagine e verificarne la filigrana utilizzando Imagen
Librerie Google GenAI
Compatibilità con la libreria OpenAI
Vertex AI in modalità Express
Panoramica
Tutorial della console
Tutorial sull'API
Modelli selezionati
Model Garden
Panoramica di Model Garden
Utilizzare i modelli in Model Garden
Testare le funzionalità del modello
Modelli supportati
Modelli Google
Panoramica
Gemini
Gemini 2.5 Pro
Gemini 2.5 Flash
Gemini 2.5 Flash Image
API Gemini 2.5 Flash Live
Gemini 2.5 Flash-Lite
Gemini 2.0 Flash
Gemini 2.0 Flash-Lite
Vertex AI Model Optimizer
Eseguire la migrazione agli ultimi modelli Gemini
SDK
Imagen
Imagen 3.0 Generate 002
Imagen 3.0 Generate 001
Imagen 3.0 Fast Generate 001
Funzionalità 001 di Imagen 3.0
Genera con Imagen 4.0
Generazione rapida di Imagen 4.0
Imagen 4.0 Ultra Generate
Anteprima della prova virtuale 08-04
Anteprima di Imagen Product Recontext 06-30
Eseguire la migrazione a Imagen 3
Veo
Veo 2
Anteprima di Veo 2
Veo 2 sperimentale
Veo 3
Veo 3 Fast
Anteprima di Veo 3
Anteprima di Veo 3 Fast
Anteprima di Veo 3.1
Anteprima di Veo 3.1 Fast
Versioni modello
Modelli gestiti
Panoramica di Model as a Service (MaaS)
Modelli di partner
Panoramica
Claude
Panoramica
Richiesta di previsioni
Previsioni batch
Memorizzazione nella cache dei prompt
Contare i token
Ricerca sul Web
Dettagli modello
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Claude 3.7 Sonnet
Claude 3.5 Haiku
Claude 3: Haiku
Mistral AI
Panoramica
Dettagli modello
Mistral Medium 3
OCR Mistral (25.05)
Mistral Small 3.1 (25.03)
Mistral Large (24.11)
Codestral 2
Codestral (25.01)
Modelli Open
Panoramica
Concedere l'accesso ai modelli open
Modelli
DeepSeek
Panoramica
DeepSeek-R1-0528
DeepSeek-V3.1
OpenAI
Panoramica
OpenAI gpt-oss-120b
OpenAI gpt-oss-20b
Qwen
Panoramica
Qwen 3 Next Instruct 80B
Qwen 3 Next Thinking 80B
Qwen 3 Coder
Qwen 3 235B
Embedding (e5)
Multilingual E5 Small
Multilingue E5 Large
Llama
Panoramica
Richiesta di previsioni
Dettagli modello
Llama 4 Maverick
Llama 4 Scout
Llama 3.3
Llama 3.2
Llama 3.1 405b
Llama 3.1 70b
Llama 3.1 8b
Deprecazioni dei modelli (MaaS)
API
Chiamare le API MaaS per i modelli aperti
Chiamata di funzione
Faccina che pensa
Output strutturato
Previsione batch
Modelli di cui è stato eseguito il deployment autonomo
Panoramica
Esegui il deployment di modelli con ponderazioni personalizzate
Google Gemma
Utilizzare Gemma
Tutorial: deployment e inferenza di Gemma (GPU)
Tutorial: deployment e inferenza di Gemma (TPU)
Llama
Utilizzare i modelli Hugging Face
Guida completa ai vLLM per la pubblicazione di LLM di testo e multimodali (GPU)
TPU vLLM
Hex-LLM
xDiT
Tutorial: esegui il deployment dei modelli Llama 3 con SpotVM e prenotazioni
Notebook di Model Garden
Tutorial: ottimizzare il rendimento del modello con le funzionalità avanzate di Model Garden
Creazione
Agenti
Panoramica
Agent Development Kit
Panoramica
Guida rapida
Esegui il deployment in Agent Engine
Agent Engine
Panoramica
Runtime
Guida rapida
Configurare l'ambiente
Sviluppare un agente
Panoramica
Agent Development Kit
Agent2Agent
LangChain
LangGraph
AG2
LlamaIndex
Personalizza
Esegui il deployment di un agente
Utilizzare un agente
Panoramica
Agent Development Kit
Agent2Agent
LangChain
LangGraph
AG2
LlamaIndex
Personalizza
Gestire gli agenti di cui è stato eseguito il deployment
Panoramica
Controllo dell'accesso
Tracciamento
Logging
Monitoraggio
Streaming bidirezionale
Utilizzo dell'interfaccia Private Service Connect
Valutare un agente
Sessioni
Panoramica delle sessioni
Gestire le sessioni utilizzando Agent Development Kit
Gestire le sessioni utilizzando le chiamate API
Memory Bank
Panoramica
Configurare Memory Bank
Guida rapida all'utilizzo dell'SDK Agent Engine
Guida rapida all'utilizzo dell'Agent Development Kit
Generare ricordi
Recuperare i ricordi
Risoluzione dei problemi
Negozio di esempio
Panoramica del negozio di esempio
Guida rapida di Example Store
Creare o riutilizzare un'istanza di Example Store
Carica esempi
Recuperare esempi
Esecuzione di codice
Panoramica dell'esecuzione del codice
Guida di avvio rapido di Esegui il codice
Ricevere assistenza