メインコンテンツまでスキップ

Unity AI Gateway

備考

ベータ版

このページでは、現在ベータ版である新しいAIゲートウェイ(UIの左側のナビゲーションに表示されます)について説明します。アカウント管理者は、アカウント コンソールの [プレビュー] ページでこの機能へのアクセスを有効にすることができます。 Databricksのプレビューを管理するを参照してください。

AIゲートウェイの以前のバージョン(Unity AIゲートウェイではない)の詳細については、「サービングエンドポイント用AIゲートウェイ(レガシー)」を参照してください。

Unity AI Gatewayは、エンタープライズAI向けのDatabricksガバナンスソリューションです。Unity Catalogを基盤として、データおよびAI資産を超えてガバナンスを拡張し、モデル、エージェント、MCPサーバー、およびツールの間のランタイムのインタラクションにまで及びます。用途:

  • チームが使用できる AI サービスを制御する : Databricksがホストするモデルおよび外部モデル、MCPサービス、エージェントをUnity Catalogに登録し、標準のUnity Catalog権限でアクセスを付与します。Databricksは、基盤モデルサービスをすぐに利用できる形で提供し、さらにGoogle Drive、Jira、Slack、GitHubなどのアプリ向けにマネージドMCPサービスを提供しています。
  • AI トラフィックを一元的にルーティングおよび管理 :リクエストをルーティングし、レート制限を設定し、フォールバックを構成し、モデルと MCP サービス全体で予算を管理します。厳格な支出上限は、予算に達した後にアラートを発するのではなく、予算到達時にリクエストを停止します。
  • **ガードレールとアクセス ポリシーを設定する**:個々のリクエストとレスポンスを許可、拒否、承認要求、または変換するために、サービスポリシーをアタッチします。組み込みポリシーは、PII漏洩、プロンプトインジェクション、および安全でないコンテンツから保護します。
  • 使用量、コスト、リスクを監視する :誰がどのサービスを使用しているか、どれくらいの費用がかかるか、および各リクエスト中に何が起こったかを、モデルとMCPアクティビティ全体での統合エージェントトレースにより追跡します。

Databricks での AI ガバナンスは初めてですか?エンドツーエンドのセットアップパスについては、AI ガバナンスの概要を参照してください。

チームが利用できる AI サービスを制御します

Unity Catalogは、AIアセットをセキュリティ保護可能なオブジェクトとして管理します。それらを一度登録するだけで、テーブルやボリュームに使用するのと同じ権限を使用してアクセスを付与および取り消すことができます。

ワークスペース間で Unity Catalog の保護可能オブジェクトとしてモデル サービスを定義して共有するには、カスタム モデル サービスを作成するを参照してください。

AIトラフィックをルーティングして管理する

Unity AI Gatewayは、中央のコントロールプレーンからモデルサービスおよびMCPサービスへのリクエストをルーティングします。Databricksホスト型プロバイダーおよび外部プロバイダー全体で、キャパシティ、可用性、使用量を管理します。

機能

説明

レート制限を適用する

容量とコストを管理するために、モデルサービスおよびMCPサービスに消費制限を適用します。

トラフィック分割とフォールバックを構成する

複数のモデルバックエンドにリクエストを分散し、フェイルオーバーを追加して可用性を高めます。

予算の管理

Databricks ホスト型プロバイダーおよび外部プロバイダー全体で、利用額を監視し、ユーザーごとのしきい値と上限を設定してください。

注記

Unity AI Gatewayの機能は、ベータ版期間中は料金が発生しません。

ガードレールとアクセスポリシーを設定する

Unity Catalogの権限付与により、プリンシパルがAIサービスを呼び出せるかどうかが決定されます。サービスポリシーは、リクエストとレスポンスのコンテンツ、および誰が呼び出しを行っているかに基づいて、そのインタラクションがどのように進行するかを管理します。これは、エージェントがユーザーに代わって行動し、外部システムにアクセスする場合に最も重要になります。

サービスポリシーは、AIサービスにスコープ設定された属性ベースのアクセス制御 (ABAC) ポリシーの一種です。相互作用に対して、人間による承認を許可、拒否、または要求したり、リクエストとレスポンスのコンテンツを変換したりできます。たとえば、system.ai.mask_piiのような組み込みポリシーを使用して、個人を特定できる情報(PII)を編集(墨消し)できます。AIセキュリティ保護可能なサービスポリシーサービスポリシーの作成とアタッチを参照してください。

使用状況、コスト、リスクを監視する

すべてのUnity AI Gatewayサービス全体で、アクティビティ、使用量、および結果を追跡します。

機能

説明

使用状況を監視する

システムテーブルを使用して、モデルサービスのリクエスト、トークン使用量、レイテンシーを追跡します。

コストを分析します。

Databricksのコストをサービス、ターゲットモデル、プリンシパル、タグに割り当てます。

リクエストとレスポンスを監査します。

モニタリングとデバッグのために、リクエストとレスポンスをUnity Catalog Deltaテーブルにログ記録します。

連携の仕組み

Unity AI Gatewayは、Unity Catalogガバナンスを3つの層にわたって構築しています。

  • **AIアセット**: Unity Catalogは、モデル、関数、接続、およびサービスを、標準のUnity Catalog権限で管理される保護可能なオブジェクトとして管理します。サービスには、モデルサービス、エージェントサービス、およびMCPサービスが含まれます。
  • AI トラフィック :Unity AI Gateway は、基盤モデル、ツール、エージェントを含むすべての AI サービスを一元的に制御するコントロールプレーンです。
  • AI サービスの動作サービスポリシーは、呼び出し元と送信される内容に基づいて、AI サービスに対するリクエストと応答のコンテンツを管理します。

Unity CatalogにおけるAIガバナンスの概念的な概要については、Unity CatalogにおけるAIガバナンスを参照してください。

モデルサービングエンドポイント (レガシー)

AI Gatewayの以前のバージョンは、外部モデルエンドポイント、基盤モデルAPIエンドポイント、カスタムモデルエンドポイントを含む、ワークスペースレベルのモデルサービングエンドポイントにガバナンス機能を提供します。

トピック

説明

サービングエンドポイント用 AI Gateway (レガシー)

サポートされている機能や制限事項など、エンドポイントを提供するための AI Gateway 機能について説明します。

モデルサービングエンドポイントでのAI Gatewayの構成(レガシー)

モデルビング エンドポイントで使用状況追跡、ペイロード ログ、レート制限、ガードレールなどのAIゲートウェイ機能を構成します。

AI Gateway対応の推論テーブルを使用して提供されているモデルを監視する(レガシー)

AI Gateway 対応の推論テーブルを使用して、提供されたモデルを監視します。

ガードレールを構成する

LLM ベースのガードレールを適用し、リクエストとレスポンスを検査して、ポリシーに違反するコンテンツをブロックまたはサニタイズします。