データベース管理者 olap

1

OLTPとOLAPの「オンライン」の定義に疑問を抱いているので、少し混乱しています。ここで「オンライン」とは、ある時点で利用可能なデータに基づいて、限られた時間内に答えを求めることを意味すると考えていました。しかし、OLAPクエリの計算には数時間かかる場合があります。これはオフラインではありませんか？クイック検索では、かなり複雑に聞こえるオフラインのOLAPが示されます（オフラインのオンライン分析処理）...？「オンライン」とは正確には何ですか？

15 transaction terminology database-theory olap online-operations

3

分析クエリのMDXとSQLの良い例

分析クエリを実行するときに、通常のSQLよりもMDXが優れている例を誰かに教えてもらえますか？MDXクエリを、同様の結果が得られるSQLクエリと比較したいと思います。ウィキペディアは言う：これらの一部を従来のSQLに変換することは可能ですが、非常に単純なMDX式の場合でも、不格好なSQL式の合成が必要になることがよくあります。しかし、引用も例もありません。基礎となるデータを異なる方法で整理する必要があること、およびOLAPでは挿入ごとにより多くの処理とストレージが必要になることを十分に認識しています。（私の提案は、Oracle RDBMSからApache Kylin + Hadoopに移行することです）コンテキスト： OLTPデータベースではなくOLAPデータベースにクエリを実行する必要があることを会社に納得させようとしています。ほとんどのSIEMクエリは、group-by、sort、aggregationを頻繁に使用します。パフォーマンスの向上に加えて、OLAP（MDX）クエリは、同等のOLTP SQLよりも簡潔で読み書きも簡単だと思います。具体例は要点を突き止めるだろうが、私はSQLの専門家ではなく、MDXははるかに少ない... 役立つ場合は、過去1週間に発生したファイアウォールイベント用のサンプルSIEM関連SQLクエリを次に示します。 SELECT 'Seoul Average' AS term, Substr(To_char(idate, 'HH24:MI'), 0, 4) || '0' AS event_time , Round(Avg(tot_accept)) AS cnt FROM ( SELECT * FROM st_event_100_#yyyymm-1m# WHERE idate BETWEEN trunc(sysdate, 'iw')-7 AND trunc(sysdate, 'iw')-3 #stat_monitor_group_query# UNION ALL SELECT * FROM st_event_100_#yyyymm# …

11 olap mdx

3

SQL Server 2012 OLAPキューブによるWebサイトの支援は妥当と考えられていますか？

私は、大規模な小売チェーン向けのソリューションの設計を任されています。彼らは、120万人の各顧客がWebサイトにログオンして、約50のカテゴリーにわたる最近の購入（当月、前月、年初から現在まで）の分布を確認できるようにしたいと考えています。データは毎日1回更新されます。 SQL Server 2012ベースのOLAPキューブを作成し、プロアクティブキャッシュなどの機能を利用して、Webサイトにこのキューブを直接クエリさせることを考えています。ただし、私は中心的な開発者であるため、SQL Serverの分析サービスの部分についてはほとんど経験がないため、このソリューションのパフォーマンスについてはかなり心配しています。 WebサイトをOLAPキューブに直接接続することは、実現可能なソリューションのように聞こえますか？そのようなシステムは、SQL Serverのように複数のユーザーからの負荷に反応して、これを合理的な解決策にしますか、それともまったく異なる動作をしますか？ユーザーが自分のステータスを頻繁に確認することは期待していません。もちろん、Webサーバーなどでキャッシュを使用します。

11 sql-server ssas olap web-server

1

中央値、モード、パーセンタイル、およびOLAP

私は頭をOLAPに巻き込もうとしている初心者ですが、いくつか質問があります。質問1： OLAPキューブは中央値、モード、パーセンタイルを格納できますか？質問2：ユーザー作成のMDXクエリは、行レベルのデータの概要を返すことができますか？（例：％トランザクション> $ 100）。または、キューブデザイナーはこれをキューブに追加する必要がありますか？質問3：行レベルのデータにアクセスするためのメカニズムを提供するOLAP製品はありますか？どっち？当社のIT部門は、特定のMS Analsis Services ROLAPキューブでどのような問題が発生しているかについてのフィードバックを求めています。その背後にあるリレーショナルデータベースへのアクセス権がないため、現在キューブ内のメジャーとして使用できない計算を実行する必要があります。私にこの権利があるかどうか見てみましょう。キューブは、カウント、平均、比率、標準偏差の統計を提供できます。キューブデザイナが提供するメジャーで特定の統計が提供されていない場合、MDXクエリを記述してそれを取得できますか？または、行レベルのデータから事前計算するためにキューブを変更する必要がありますか？キューブは、中央値、モード、パーセンタイルなどの統計を提供できません。これらの統計は適切に集計されないためです。 Leland WilkinsonのThe Grammar of Graphicsと、Data MiningとOLAPに関する彼の章を読んでいると彼は言うこれらの[キューブ操作]は、カウント、平均、比率、標準偏差などの統計でうまく機能します。サブクラスの単純な集計は、和、二乗和、および線形関数で結合されて基本的な要約統計量を生成する他の項を操作することによって計算できます。これらの統計の集計はそれらの集計の統計ではないため、中央値、モード、パーセンタイルなどの統計では正しく機能しません。たとえば、中央値の中央値は、集計の中央値ではありません。彼は続けて追加します：しかし、より洗練されたROLAPモデルが最近登場しました。いくつかのテクノロジーを通じて、統計アルゴリズムがリレーショナルモデルを通じて生データにリアルタイムでアクセスできるようにすることができます。このアプローチは、データキューブなどの構造によって提供される固定集計よりも有望です。このアーキテクチャの最もエレガントな形式では、アプリケーションはリモート接続を要求して、データ処理方法に関する情報を提供し、返された情報に応じて適切なアクションを実行できます。この形式では、コンポーネントアーキテクチャは、分散コンピューティングの真の期待、つまりサイト、オペレーティングシステム、または言語に依存しない設計と実行を実現できます。それは2005年頃に書かれました。行レベルのデータアクセスを可能にするためにこの方法論を採用している製品を知っている人はいますか？

9 ssas statistics olap

4

インメモリOLAPには、大量のメモリを備えた従来のシステムと比べてどのような利点がありますか？

インメモリOLAPエンジンは、キューブ全体を格納するのに十分なRAMに支えられた従来のOLAPエンジンよりも優れていますか？たとえば、MOLAPエンジン（SSAS）とGB / TBのRAMを使用していて、キューブ全体（またはスタースキーマも）がRAMに常駐している場合、TM1 / SAP HANAと比べて何が違うのですか？

8 data-warehouse business-intelligence olap in-memory-database

タグ付けされた質問 「olap」

タグ付けされた質問「olap」