回答:
詳細については、こちらをご覧ください。
前のリンクから:
データベース
データウェアハウス
データウェアハウスはゼロから多数のデータベースに供給される可能性があることにも注意することが重要です。
非技術的観点から:データベースは特定のアプリケーションまたはアプリケーションのセットに制限されています。
データウェアハウスは、エンタープライズレベルのデータリポジトリです。ビジネスのすべて/多くのセグメントからのデータが含まれます。この情報を共有して、ビジネスの全体像を提供します。ビジネスの異なるセグメント間の統合も重要です。
技術的な観点から:「データウェアハウス」という言葉には、明確な定義はありません。個人的には、データウェアハウスをデータマートのコレクションとして定義しています。各データマートは、データベースが特定の問題セット(アプリケーション、データセット、またはプロセス)に固有である1つ以上のデータベースで構成されます。
簡単に言えば、データベースはデータウェアハウスのコンポーネントです。この概念を探求する場所はたくさんありますが、「定義」がないので、どんな答えでも挑戦を見つけるでしょう。
データウェアハウスはデータベースの一種です。
人々がすでに言ったことに加えて、データウェアハウスはOLAPである傾向があり、インデックスなどは書き込みではなく読み取り用に調整されており、データは非正規化/読みやすく分析しやすい形式に変換されます。
「データベース」はOLTPと同じだと言う人もいますが、これは正しくありません。OLTPもデータベースの一種です。
その他のタイプの「データベース」:テキストファイル、XML、Excel、CSV ...、フラットファイル:-)
It is a logical subset of Data warehouse, generally based upon business functions.
データベース:-OLTP(オンライントランザクションプロセス)
データウェアハウス
データウェアハウスとデータベース:データウェアハウスは、データ分析のために特別に設計されています。これには、大量のデータを読み取り、データ間の関係と傾向を理解することが含まれます。データベースは、トランザクションの詳細の記録など、データをキャプチャして保存するために使用されます。
データウェアハウス:適切なワークロード -分析、レポート、ビッグデータ。 データソース -多くのソースから収集および正規化されたデータ。 データキャプチャ -通常、事前に定義されたバッチスケジュールでの一括書き込み操作。 データの正規化 -スタースキーマやスノーフレークスキーマなどの非正規化スキーマ。 データストレージ -アクセスの簡素化と高速クエリのために最適化されています。カラム型ストレージを使用したパフォーマンス。 データアクセス -I / Oを最小化し、データスループットを最大化するように最適化されています。
トランザクションデータベース:適切なワークロード -トランザクション処理。 データソース -トランザクションシステムなど、単一のソースからそのままキャプチャされたデータ。 データキャプチャ -新しいデータが利用可能になり、トランザクションのスループットを最大化できるため、継続的な書き込み操作用に最適化されています。 データの正規化 -高度に正規化された静的スキーマ。 データストレージ -単一の行指向の物理ブロックへの書き込み操作全体で最適化されます。 データアクセス -大量の小さな読み取り操作。
データウェアハウスのソースは、データベースのクラスターにすることができます。データベースは、現在のレコードを保持するなどのオンライントランザクションプロセスで使用されます。
データウェアハウスは、通常データベースに格納されるデータ構造の一種です。データウェアハウスは、データモデルとそこに格納されているデータの種類を参照します-分析目的で使用するためにモデル化されたデータ(データモデル)。
データベースは、データを格納する任意の構造として分類できます。従来は、Oracle、SQL Server、MySQLなどのRDBMSでした。ただし、データベースは、Apache CassandraのようなNoSQLデータベース、またはAWS RedShiftのような列型MPPにすることもできます。
データベースは単にデータを保存する場所であることがわかります。データウェアハウスは、データを格納する特定の方法であり、分析クエリを提供するという特定の目的を果たします。
OLTPとOLAPでは、DWとデータベースの違いはわかりません。OLTPとOLAPの両方がデータベースに存在します。異なる方法(異なるデータモデル手法)でデータを格納し、異なる目的(OLTP-更新用に最適化されたトランザクションの記録、OLAP-読み取り用に最適化された情報の分析)を提供するだけです。
簡単な言葉で見てください:データウェア->分析/ストレージ/コピーおよび分析に使用する巨大なデータ。データベース->頻繁に使用されるデータを使用したCRUD操作。
データウェアハウスは日常的に使用していない種類のストレージであり、データベースは頻繁に取引されるものです。
例えば。銀行の声明を求めている場合、それは最後の3/4/6 /月以上bcozでデータベースにあります。それ以上のデータが必要な場合は、Datawareハウスに保存します。
例:家は価値があり$100,000
、$1000
年間で高く評価されています。
現在の家の値を追跡するには、値が毎年変化するため、データベースを使用します。
3年後、あなたはある家の価値を見ることができるでしょう $103,000.
住宅の歴史的な価値を追跡するには、住宅の価値が
$100,000 on year 0,
$101,000 on year 1,
$102,000 on year 2,
$103,000 on year 3.