Pular para o conteúdo principal

Portal AI Unity

info

Beta

Esta página aborda o novo Gateway AI (visível na barra de navegação à esquerda da interface do usuário), que está atualmente em versão Beta. Os administradores da conta podem habilitar o acesso a este recurso na página de pré-visualizações do console account . Veja as prévias do Gerenciador Databricks.

Para obter detalhes sobre a versão anterior do AI Gateway (não Unity AI Gateway), consulte AI Gateway para veiculação de endpoint (legado).

O Unity AI Gateway é a solução de governança da Databricks para AI corporativa. Construído sobre o Unity Catalog, ele estende a governança além de seus ativos de dados e AI para as interações de tempo de execução entre modelos, agentes, servidores MCP e ferramentas. Use-o para:

  • Controle quais serviços de AI as equipes podem usar : Faça o registro de modelos hospedados pela Databricks e modelos externos, serviços MCP e agentes no Unity Catalog e, em seguida, conceda acesso com privilégios padrão do Unity Catalog. A Databricks oferece serviços de modelo base prontos para uso, além de serviços MCP gerenciados para aplicativos como Google Drive, Jira, Slack e GitHub.
  • Direcionar e gerenciar o tráfego de AI centralmente : Direcione solicitações, defina limites de taxa, configure fallbacks e gerencie orçamentos em modelos e serviços MCP. Limites rígidos de gastos interrompem as solicitações quando um orçamento é atingido, em vez de alertar depois do ocorrido.
  • Defina proteções e políticas de acesso : anexe políticas de serviço para permitir, negar, exigir aprovação ou transformar solicitações e respostas individuais. Políticas integradas protegem contra exposição de PII, injeção de prompt e conteúdo não seguro.
  • Monitore o uso, o custo e o risco : Acompanhe quem usa quais serviços, quanto gastam e o que aconteceu durante cada solicitação, com rastreamento de agente unificado em atividades de modelo e MCP.

É novo na governança de AI no Databricks? Consulte Comece com a governança de AI para um caminho de configuração de ponta a ponta.

Controle quais serviços de AI as equipes podem usar

O Unity Catalog gerencia ativos de AI como objetos protegíveis. Registre-os uma vez, em seguida, conceda e revogue o acesso usando os mesmos privilégios que você usa para tabelas e volumes:

Para definir e compartilhar serviços de modelo como objetos protegíveis do Unity Catalog entre workspace, consulte Criar serviços de modelo personalizados.

Roteie e gerenciar o tráfego de AI

O Unity AI Gateway encaminha as solicitações para seus serviços de modelo e serviços MCP a partir de um plano de controle central. Gerenciar capacidade, disponibilidade e gastos em provedores hospedados pelo Databricks e externos:

Capacidade

Descrição

Aplicar limites de taxa

Aplique limites de consumo em serviços de modelo e serviços MCP para gerenciar capacidade e custo.

Configure a divisão de tráfego e fallbacks.

Distribua solicitações entre vários backends de modelo e adicione failover para aumentar a disponibilidade.

Gerenciar orçamentos

Monitore os gastos e defina limites por usuário e tetos máximos para provedores hospedados pelo Databricks e provedores externos.

nota

O recurso Unity AI Gateway não gera custos durante a versão Beta.

Defina limites de segurança e políticas de acesso

As concessões de privilégios do Unity Catalog determinam se uma entidade pode chamar um serviço de AI. As políticas de serviço governam como essa interação prossegue, com base no conteúdo da solicitação e da resposta e em quem está fazendo a chamada. Isso é mais importante quando os agentes agem em nome dos usuários e acessam sistemas externos.

Uma política de serviço é um tipo de política de controle de acesso baseado em atributos (ABAC) com escopo para serviços de AI. Você pode permitir, negar ou exigir aprovação humana para uma interação, ou transformar o conteúdo da solicitação e da resposta, por exemplo, ocultando informações de identificação pessoal (PII) com uma política integrada, como system.ai.mask_pii. Consulte Políticas de serviço para segurança de AI e Criar e anexar uma política de serviço.

Monitorar uso, custo e risco

Acompanhe a atividade, os gastos e os resultados em todos os serviços do Unity AI Gateway:

Capacidade

Descrição

Monitore o uso

Acompanhe solicitações, uso de tokens e latência para serviços de modelo usando tabelas do sistema.

Analisar custo

Atribua o custo do Databricks a serviços, modelos de destino, entidades de serviço e tags.

Audite as solicitações e respostas

Faça o log de solicitações e respostas em tabelas Delta do Unity Catalog para monitoramento e depuração.

Como funciona em conjunto

O Unity AI Gateway baseia-se na governança do Unity Catalog em três camadas:

Para uma visão geral conceitual da governança de AI no Unity Catalog, consulte governança de AI no Unity Catalog.

endpoint de modelo de navegação (anterior)

A versão anterior do AI Gateway oferece recursos de governança para endpoints de servindo modelo no nível do workspace, incluindo endpoints de modelo externos, endpoints de API de modelo base e endpoints de modelo personalizados.

tópico

Descrição

AI Gateway para servir endpoint (legado)

Saiba mais sobre o recurso do AI Gateway para servir endpoints, incluindo recursos suportados e limitações.

Configurar o AI Gateway em endpoint servindo modelo (legado)

Configure os recursos do AI Gateway, como acompanhamento de uso, registro de payloads, limites de taxa e proteções em um endpoint de modelo de serviço.

Monitore modelos servidos usando tabelas de inferência habilitadas para Gateway de AI (legado)

Monitore os modelos utilizados com tabelas de inferência habilitadas pelo AI Gateway.

Configure guardrails

Aplique barreiras de segurança baseadas em LLM para inspecionar solicitações e respostas e bloquear ou limpar o conteúdo que viola as suas políticas.