みなさまの組織では、ガバナンス、特にデータガバナンスは効いている状態でしょうか?
競争優位性を高めるには、組織がデータとAI を活用して意思決定を行えることが重要であり、ここ最近の生成AI の勃興によってデータとAI の重要性がさらに高まっていると言えます。
生成AI 以前もデータの活用は進んでいましたが、それと同時にデータガバナンスの重要性も注目されていました。
データガバナンスとは、組織がデータを効率的かつ安全に活用するための管理体制やルールのことを指します。データガバナンスが効いている組織においては、データを活用するデータエンジニアやデータサイエンティスト、データアナリストは安心してデータを活用し、迅速にビジネス洞察を導き出すことができます。
しかし、データガバナンスを組織全体に行き渡らせることは簡単なことではありません。
データガバナンスの定義や実装、運用などを一から行おうとすると、システム開発や運用のコストが増加し、実効性のあるものにならない場合があります。さらに問題を複雑にしているのはAIです。組織においてデータやAI から勝ちを導き出すためには、データのみならずAIで活用する機械学習モデル、その他のフォーマットのファイル、BI ダッシュボードなど、データやAIに関連するすべての資産が適切に管理、活用されていることを確実にする必要性に迫られています。
このような状況において、データブリックスが提供する統合ガバナンスソリューションであるUnity Catalog は、以下のようなデータやAI活用におけるガバナンスの課題のほとんどを解決します。
- 目の前にあるテーブルをどのように活用したらいいのかがわからない。どのようなクエリーを行えばいいのかわからない。
- 目の前にあるテーブルが作成された経緯がわからず、容易に活用できない。
- 特定のテーブルに詳しい専門家が特定できず問い合わせられない。
- 特定のテーブルがどこで利用されているのかわからず、更新・削除が行えない。
- テーブルやデータベースはもちろん、機械学習モデルやファイルに対するアクセス制御が煩雑で運用できない。
- データに対するアクセスコントロールの粒度が粗く、セキュリティレベルを高めると分析が行えない。
本セッションでは、Unity Catalog がどのようにして上述したガバナンスの課題を解決するのかをデモを交えてご説明し、Unity Catalog を利用する際に留意すべきベストプラクティスをご紹介します。
講師
データブリックス・ジャパン株式会社 ソリューションアーキテクト部 部長 弥生 隆明