頻繁に繰り返される質問の1つに、「データ仮想化とETLツールはそれぞれどのような場合に使用したらよいのか」ということがあります。 あるいは、同様の趣旨で、「データ仮想化はETLに代わるものなのか」、「すでにETLを使用しているのに、なぜデータ仮想化が必要なのか」といったような質問を受けることもあります。 このDenodo Technologiesアーキテクチャブリーフでは、そうした疑問にお答えします。
抽出、変換、ロード(ETL)は物理データ統合プロジェクトに適したソリューションであり、元のデータソースのデータがエンタープライズデータウェアハウス(EDW)または新しいデータベース内に複製されます。 このソリューションでは以下のような機能が提供されます。
- 大規模な構造化データソースからの数百万行に及ぶ膨大なデータセットの一括コピーが可能なETLツール
- 時間の経過に伴うデータセットの変化を分析するための履歴データの記録の作成(特定の時間のスナップショットなど)
- 複雑なマルチパスのデータ変換とクレンジング操作の実行、ターゲットデータストアへのデータの一括読み込み
データ仮想化とETLという2つのソリューションに違いはありますが、多くの場合には相補的なテクノロジーであるというの が実情です。データ仮想化では、ETL/EDWの展開を多くの方法で拡張および強化できます。以下にその例を示します。
- 既存のデータウェアハウスを新しいデータソースで拡張する
- 複数のデータウェアハウスを統合するActing as a virtual data source to augment an ETL process
- ETLプロセスを強化するための仮想データソースとして機能させる
- 基盤となるデータソースに変更があってもアプリケーションに影響が及ばないようにする(データウェアハウスの移行など)