統合データウェアハウスと分散データウェアハウスの違いは何ですか?


9

これらの明確な定義や説明は見つかりません。どちらも分散型のようです。フェデレーテッドDWHでは、データは分散され、単一のリポジトリに統合されず、分散ソースからアクセスされるようです。

分散型DWH実装では、データは1つの中央リポジトリに統合されます。

これら2つの実装の違いを説明してください。

回答:


6

分散型データウェアハウスは、本質的には、個々のリージョンまたはビジネスユニットによって維持されているが、中央で利用可能になっているデータウェアハウスのコレクションです。これらは同じ物理サーバー上にある、レポートツールを共有する、または他の方法で組織全体で利用できるようにすることができます。マスターデータ管理などの集中型コンポーネントも存在する場合があります。これは通常、一元化されたデータウェアハウスが特定の規模の組織を超えて扱いにくくなるために行われます。データウェアハウスは変更に対応する必要があり、応答が遅すぎる場合は、個々の部門が独自のソリューションの構築を開始します。

これは投資銀行で見ることができます。ビジネス全体に集中型のウェアハウスを構築するのではなく、特定の要件(特定の規制イニシアチブやある種の財務報告など)を満たすためにデータウェアハウスを実行する傾向があります。大規模な銀行の規模の企業は、完全に集中化されたEDWの要件を妥当な時間内に実行するには複雑すぎる。

連合データウェアハウスは、分散データウェアハウス全体にマスター統合レイヤーを追加します。すべての部門に汎用MIプラットフォームを提供するのではなく、企業全体またはグループレベルのレポート用にビジネス全体の主要なメトリックを統合することを目的としているため、通常、これはデータの狭い垂直スライスのみを収容します。部門は、独自のEDWまたはMIシステムを作成する必要がありますが、中央の統合レイヤーの設定に必要なデータセットを提供する必要があります。

このアーキテクチャは、両方の長所を提供します。中央管理は組織全体のメトリックを確認でき、部門はニーズに合わせてMIソリューションを調整できます。中央管理では、部門のシステムによって提供されるフィードとして、アナリティクスとMIに必要なデータ要件を課すだけで済みます。特定の部門についてより詳細なレポートまたは分析が必要な場合は、部門システムがこれを提供できます。

以下のリンク先の記事では、フェデレーションデータウェアハウスについてさらに詳しく説明しています。

http://www.zentut.com/data-warehouse/federated-data-warehouse-architecture/

この記事では、データウェアハウスのトポロジについてさらに詳しく説明します。

https://www.ibmbigdatahub.com/blog/data-warehouse-architectures-multinational-organizations-part-1

https://www.ibmbigdatahub.com/blog/data-warehouse-architectures-multinational-organizations-part-2


どちらも分散型ですが、フェデレーションはサブセット(主要なメトリック)を1か所に統合​​しますか?
LifeH2O

はい。そのとおりです。これらの定義は非常に非公式なので、人々はそれらを異なる方法で使用する可能性があることを覚えておいてください。フェデレーションアーキテクチャの提案を1回行ったにもかかわらず、どちらの種類のシステムを構築することもありませんでした。使用している定義によって分散化されていると特徴付けられるシステムを備えたサイトがいくつかありました。
ConcernedOfTunbridgeWells
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.