Portal AI Unity
Beta
Esta página aborda o novo Gateway AI (visível na barra de navegação à esquerda da interface do usuário), que está atualmente em versão Beta. Os administradores da conta podem habilitar o acesso a este recurso na página de pré-visualizações do console account . Veja as prévias do Gerenciador Databricks.
Para obter detalhes sobre a versão anterior do AI Gateway (não Unity AI Gateway), consulte AI Gateway para veiculação de endpoint (legado).
O Unity AI Gateway é a solução de governança da Databricks para AI corporativa. Construído sobre o Unity Catalog, ele estende a governança além de seus ativos de dados e AI para as interações de tempo de execução entre modelos, agentes, servidores MCP e ferramentas. Use-o para:
- Controle quais serviços de AI as equipes podem usar : Faça o registro de modelos hospedados pela Databricks e modelos externos, serviços MCP e agentes no Unity Catalog e, em seguida, conceda acesso com privilégios padrão do Unity Catalog. A Databricks oferece serviços de modelo base prontos para uso, além de serviços MCP gerenciados para aplicativos como Google Drive, Jira, Slack e GitHub.
- Direcionar e gerenciar o tráfego de AI centralmente : Direcione solicitações, defina limites de taxa, configure fallbacks e gerencie orçamentos em modelos e serviços MCP. Limites rígidos de gastos interrompem as solicitações quando um orçamento é atingido, em vez de alertar depois do ocorrido.
- Defina proteções e políticas de acesso : anexe políticas de serviço para permitir, negar, exigir aprovação ou transformar solicitações e respostas individuais. Políticas integradas protegem contra exposição de PII, injeção de prompt e conteúdo não seguro.
- Monitore o uso, o custo e o risco : Acompanhe quem usa quais serviços, quanto gastam e o que aconteceu durante cada solicitação, com rastreamento de agente unificado em atividades de modelo e MCP.
É novo na governança de AI no Databricks? Consulte Comece com a governança de AI para um caminho de configuração de ponta a ponta.
Controle quais serviços de AI as equipes podem usar
O Unity Catalog gerencia ativos de AI como objetos protegíveis. Registre-os uma vez, em seguida, conceda e revogue o acesso usando os mesmos privilégios que você usa para tabelas e volumes:
- Modelos : Modelos de ML registrados no Unity Catalog, incluindo modelos de fundação hospedados, que são modelos de fundação hospedados pela Databricks disponíveis por meio das APIs do Foundation Model. Veja Gerenciar o ciclo de vida do modelo e permissões do Unity Catalog para modelos de fundação.
- Ferramentas MCP : servidores MCP registrados como objetos securáveis do Unity Catalog, com filtragem de ferramentas e políticas de serviço. Consulte Conecte agentes a ferramentas de terceiros com serviços MCP.
- Agentes : agentes de AI registrados como objetos protegíveis do Unity Catalog e governados juntamente com suas tabelas, modelos e funções.
- **Conexões**: conexões HTTP do Unity Catalog usadas para acessar APIs externas e servidores MCP. Consulte Conexões HTTP.
- Funções : Funções do Unity Catalog usadas como ferramentas de agente ou para transformações de dados. Consulte Criar ferramentas de agente de AI usando funções do Unity Catalog.
Para definir e compartilhar serviços de modelo como objetos protegíveis do Unity Catalog entre workspace, consulte Criar serviços de modelo personalizados.
Roteie e gerenciar o tráfego de AI
O Unity AI Gateway encaminha as solicitações para seus serviços de modelo e serviços MCP a partir de um plano de controle central. Gerenciar capacidade, disponibilidade e gastos em provedores hospedados pelo Databricks e externos:
Capacidade | Descrição |
|---|---|
Aplique limites de consumo em serviços de modelo e serviços MCP para gerenciar capacidade e custo. | |
Distribua solicitações entre vários backends de modelo e adicione failover para aumentar a disponibilidade. | |
Monitore os gastos e defina limites por usuário e tetos máximos para provedores hospedados pelo Databricks e provedores externos. |
O recurso Unity AI Gateway não gera custos durante a versão Beta.
Defina limites de segurança e políticas de acesso
As concessões de privilégios do Unity Catalog determinam se uma entidade pode chamar um serviço de AI. As políticas de serviço governam como essa interação prossegue, com base no conteúdo da solicitação e da resposta e em quem está fazendo a chamada. Isso é mais importante quando os agentes agem em nome dos usuários e acessam sistemas externos.
Uma política de serviço é um tipo de política de controle de acesso baseado em atributos (ABAC) com escopo para serviços de AI. Você pode permitir, negar ou exigir aprovação humana para uma interação, ou transformar o conteúdo da solicitação e da resposta, por exemplo, ocultando informações de identificação pessoal (PII) com uma política integrada, como system.ai.mask_pii. Consulte Políticas de serviço para segurança de AI e Criar e anexar uma política de serviço.
Monitorar uso, custo e risco
Acompanhe a atividade, os gastos e os resultados em todos os serviços do Unity AI Gateway:
Capacidade | Descrição |
|---|---|
Acompanhe solicitações, uso de tokens e latência para serviços de modelo usando tabelas do sistema. | |
Atribua o custo do Databricks a serviços, modelos de destino, entidades de serviço e tags. | |
Faça o log de solicitações e respostas em tabelas Delta do Unity Catalog para monitoramento e depuração. |
Como funciona em conjunto
O Unity AI Gateway baseia-se na governança do Unity Catalog em três camadas:
- **Ativos de AI**: O Unity Catalog gerencia modelos, funções, conexões e serviços como objetos protegíveis, governados com privilégios padrão do Unity Catalog. Os serviços incluem serviços de modelo, serviços de agente e serviços MCP.
- **Tráfego de AI**: O Unity AI Gateway é o plano de controle que fornece controle central para todos os serviços de AI, incluindo modelos de base, ferramentas e agentes.
- **Comportamento do serviço de IA**: Aspolíticas de serviço governam o conteúdo das solicitações e respostas aos serviços de IA, com base em quem está chamando e o que é enviado.
Para uma visão geral conceitual da governança de AI no Unity Catalog, consulte governança de AI no Unity Catalog.
endpoint de modelo de navegação (anterior)
A versão anterior do AI Gateway oferece recursos de governança para endpoints de servindo modelo no nível do workspace, incluindo endpoints de modelo externos, endpoints de API de modelo base e endpoints de modelo personalizados.
tópico | Descrição |
|---|---|
Saiba mais sobre o recurso do AI Gateway para servir endpoints, incluindo recursos suportados e limitações. | |
Configurar o AI Gateway em endpoint servindo modelo (legado) | Configure os recursos do AI Gateway, como acompanhamento de uso, registro de payloads, limites de taxa e proteções em um endpoint de modelo de serviço. |
Monitore modelos servidos usando tabelas de inferência habilitadas para Gateway de AI (legado) | Monitore os modelos utilizados com tabelas de inferência habilitadas pelo AI Gateway. |
Aplique barreiras de segurança baseadas em LLM para inspecionar solicitações e respostas e bloquear ou limpar o conteúdo que viola as suas políticas. |