Data Virtualization and ETL

ダウンロード

 2014/11/12

頻繁に繰り返される質問の1つに、「データ仮想化とETLツールはそれぞれどのような場合に使用したらよいのか」ということがあります。 あるいは、同様の趣旨で、「データ仮想化はETLに代わるものなのか」、「すでにETLを使用しているのに、なぜデータ仮想化が必要なのか」といったような質問を受けることもあります。 このDenodo Technologiesアーキテクチャブリーフでは、そうした疑問にお答えします。

抽出、変換、ロード(ETL)は物理データ統合プロジェクトに適したソリューションであり、元のデータソースのデータがエンタープライズデータウェアハウス(EDW)または新しいデータベース内に複製されます。 このソリューションでは以下のような機能が提供されます。

  • 大規模な構造化データソースからの数百万行に及ぶ膨大なデータセットの一括コピーが可能なETLツール
  • 時間の経過に伴うデータセットの変化を分析するための履歴データの記録の作成(特定の時間のスナップショットなど)
  • 複雑なマルチパスのデータ変換とクレンジング操作の実行、ターゲットデータストアへのデータの一括読み込み

データ仮想化とETLという2つのソリューションに違いはありますが、多くの場合には相補的なテクノロジーであるというの が実情です。データ仮想化では、ETL/EDWの展開を多くの方法で拡張および強化できます。以下にその例を示します。

  • 既存のデータウェアハウスを新しいデータソースで拡張する
  • 複数のデータウェアハウスを統合するActing as a virtual data source to augment an ETL process
  • ETLプロセスを強化するための仮想データソースとして機能させる
  • 基盤となるデータソースに変更があってもアプリケーションに影響が及ばないようにする(データウェアハウスの移行など)

次のステップ

データからリアルタイムで知見を導き出し、デジタル変革を今すぐ始めましょう!