EDAに対するベイジアンと頻繁なアプローチに違いはありますか?


14

簡単に言えば、探索的データ分析に対するベイジアンとフリークエンティストのアプローチに違いはありますか?

ヒストグラムはヒストグラムであり、散布図は散布図などであるため、EDAメソッドに固有のバイアスはありません。また、EDAの教え方や提示方法の違いの例を発見していません(A. Gelmanによる特に理論的な論文は無視します) 。最後に、適用されたすべての事項の調停者であるCRANを調べました。ベイジアンアプローチに合わせたパッケージは見つかりませんでした。ただし、CVにはこの点を明らかにできる少数の人がいると思いました。

なぜ違いがあるのですか?

手始めに:

  1. 適切な事前分布を特定する場合、これを視覚的に調査するべきではありませんか?
  2. データを要約して、頻度モデルまたはベイジアンモデルのどちらを使用するかを提案する場合、EDAはどの方向に進むべきかを提案すべきではありませんか?
  3. 2つのアプローチには、混合モデルの処理方法に非常に明確な違いがあります。サンプルが母集団の混合物に由来する可能性が高いことを識別することは困難であり、混合パラメーターを推定するために使用される方法論に直接関連しています。
  4. どちらのアプローチにも確率モデルが組み込まれており、モデルの選択はデータを理解することにより推進されます。より複雑なデータまたはより複雑なモデルは、EDAでより多くの時間を必要とします。このような確率モデルまたは生成プロセスの違いにより、EDAアクティビティに違いがあるため、異なる確率的アプローチから生じる違いはないのでしょうか。

注1:私はどちらの「キャンプ」の哲学にも関心がない-私はEDAツールキットと方法のギャップにのみ対処したい。

回答:


17

私の考えでは、ベイズ対頻度論者は形式的な推論に関するものであり、探索的データ分析もそうではありません。

確かに、ポイント(1)、(3)、および(4)を分類するモデル評価/適合度および感度分析に関しては、どのように進むかには違いがありますが、それは、哲学に関するものではなく、分析方法と計算方法の違いの性質だからです。

あなたの(2)に関して、私はEDAの結果がベイジアンまたはフリークエンティストのアプローチに向けられていると一般的には見ていませんが、むしろそれが最も重要な研究の目標だと思います。

私にとって個人的には、EDA(および深いイントロスペクション)はモデルに向かって私を指し示し、科学的な質問に合理的によく答える自然な頻度主義者のアプローチを見つけることができれば、それで行きますが、状況の性質によって、頻繁な方法はうまく機能しません。また、妥当な事前がある場合は、ベイズを使用します。


(+1)非常によく言われています-特に、「EDA(プラスの深いイントロスペクション)はモデルに私を向けるでしょう」
-suncoolsu

+1も。EDAは、視点を選択することではなく、データに基づいてより多くの情報に基づいた意思決定を行うことを目的としています。
フォマイト

+1良い答えを。残念ながら、元の質問は誤解されていたと思います。私は、EDAを使用してベイジアンモデルと頻度主義モデルのどちらを決定するかを尋ねていませんでした。複数の人が同じ誤解を持っていると思われる場合は、私がそれをどのように表現したかを確認する必要があります。
イテレーター

@Iteratorあなたの主な質問は次のとおりです。ベイジアンのアプローチとフリークエンティストのEDAに対するアプローチに違いはありますか?それに対する私の答えは:いいえ。EDAは頻度主義者でもベイジアンでもありません。
カール

3
「探索的データ分析」の私の定義は、あなたのものよりも狭いと思います。私の見解では、すべての優れたデータ分析には探索が含まれます。「探索的データ分析」の特徴は、モデルの欠如または正式な推論に向けた努力です。
カール

0

EDAは、モデルの構築、いくつかの仮定の作成、および(必要に応じて)モデルとその仮定の更新を支援すると思います。モデルのフィッティングと評価に使用する実用的なアプローチを選択します。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.