経験的ベイズはどのように有効ですか?


24

だから私はちょうど素晴らしい本入門の経験的ベイズを読み終えました。この本は素晴らしいと思いましたが、データからの事前作成は間違っていると感じました。分析計画を立て、データを収集し、分析計画で以前に決定した仮説をテストするように訓練されました。すでに収集したデータを分析すると、選択後の推論が行われ、「重要」と呼ばれるものをより厳しくする必要があります。こちらを参照してください。機械学習には、テストとトレーニングセットを設定する前に予測子を選択することを意味する「チェリーピッキング」と呼ばれる類似したものがあると思います(統計学習の概要)。

私が以前に学んだことを考えると、経験的なベイズは弱い基盤に基づいているように思えます。データが受動的に生成された設定でのみ使用されますか?もしそうなら、これは正当かもしれませんが、厳密な実験計画を行うときにそれを使用するのは正しくないようですが、ブラッド・エフロンは一般に非常にNHST分野である生物統計学のために経験的ベイズを使用することを知っています。

私の質問は:

  1. 経験的ベイズはどのように有効ですか?
  2. どのような状況で使用されますか?
  3. どのような状況で経験的ベイズアプローチの使用を避ける必要がありますか?その理由は?
  4. 人々は生物統計学以外の分野でそれを使用していますか?もしそうなら、どのような状況でそれを使用していますか?

1
「有効」とはどういう意味ですか?亡くなった著名なベイジアン、DVリンドリーによると、「経験的なベイジアンほどベイジアンに劣るものはいない」。
マークL.ストーン

回答:


16

さまざまな方法がさまざまなことに適していることを覚えておくことが重要だと思います。統計の世界には有意性検定だけがすべてではありません。

1および3)EBはおそらく有効な仮説検定手順ではありませんが、そうすることも意図していません。

妥当性は多くの可能性がありますが、厳密な実験計画について話しているので、特定の長期的な頻度で適切な決定を下すのに役立つと思われる仮説検定についておそらく議論しています。これは厳密に二分されたイエス/ノータイプの制度であり、イエス/ノータイプの決定をしなければならない人々にとって主に有用です。実際、非常に賢い人々によるこれに関する多くの古典的な仕事があります。これらの方法は、すべての仮定が成り立つと仮定して、限界において素晴らしい理論的妥当性を持っています。ただし、EBは確かにこれを目的としていませんでした。従来のNHSTメソッドの機構が必要な場合は、従来のNHSTメソッドに固執してください。


2)EBは、多くの類似した可変量を推定する問題に最適です。

エフロン自身が、統計の歴史の3つの異なる時代をリストした大規模推論という本を開き、現在私たちがいることを指摘しています

科学的大量生産の時代。マイクロアレイに代表される新しい技術により、単一の科学者チームがケトレのlet望するサイズのデータ​​セットを作成できます。しかし、今ではデータの洪水に伴い、統計学者が一緒に回答することを担当している数千の推定値や仮説検定の質問が殺到しています。古典的なマスターが念頭に置いていたものではありません。

彼は続けます:

その性質により、経験的ベイズの議論は、繰り返し構造の問題を分析する際に、頻繁な要素とベイジアン要素を組み合わせています。繰り返し構造は、科学的大量生産が得意とするものであり、例えば、マイクロアレイを用いて同時に何千もの遺伝子について病気の被験者と健康な被験者を比較する発現レベルです。

おそらく、最近最も成功したEBのアプリケーションはlimmaBioconductor入手できます。これは、数万の遺伝子にわたる2つの研究グループ間の差次的発現(すなわちマイクロアレイ)を評価する方法を備えたRパッケージです。Smythは、彼らのEBメソッドが、通常の遺伝子ごとのt統計を計算する場合よりも自由度の高いt統計を生成することを示しています。ここでのEBの使用は、「プールされた推定値に対する推定サンプル分散の収縮に相当し、配列の数が少ない場合にはるかに安定した推論をもたらす」ことがよくあります。

エフロンが上記で指摘したように、これは古典的なNHSTが開発されたものとは異なり、通常、設定は確認的よりも探索的です。


4)一般に、EBは収縮方法として見ることができ、収縮が有用なすべての場所で有用です。

limmaバツ1バツkθ^JS=1c/S2バツS2=j=1kバツjcバツ

バツ¯

収縮

推定される量が類似しているほど、収縮が有用である可能性が高くなります。あなたが参照する本は野球のヒット率を使用しています。Morris(1983)は、いくつかの他のアプリケーションを示しています。

  • 収益分配---国勢調査局。いくつかの地域の1人当たりの国勢調査収入の推定。
  • 品質保証--- Bell Labs。さまざまな期間の障害の数を推定します。
  • 保険料率決定。被保険者グループまたは異なる地域のエクスポージャーごとのリスクを推定します。
  • ロースクール入学。さまざまな学校のGPAに対するLSATスコアの重みを推定します。
  • 火災警報器--- NYC。異なるアラームボックスの場所の誤警報率を推定します。

これらはすべて並列推定の問題であり、私が知る限り、イエス/ノーの決定を理解することよりも、特定の量が何であるかを適切に予測することの方が重要です。


いくつかの参照

  • エフロン、B。(2012)。大規模推論:推定、テスト、予測のための経験的ベイズ法(Vol。1)。ケンブリッジ大学出版局。シカゴ
  • エフロン、B。&モリス、C。(1973)。スタインの推定ルールとその競合他社-経験的ベイズアプローチ。Journal of the American Statistical Association、68(341)、117-130。シカゴ
  • ジェームズ、W。&スタイン、C。(1961年6月)。二次損失を伴う推定。数学統計と確率に関する第4回バークレーシンポジウムの議事録(Vol。1、No. 1961、pp。361-379)。シカゴ
  • モリス、CN(1983)。パラメトリック経験的ベイズ推論:理論と応用。Journal of the American Statistics Association、78(381)、47-55。
  • スミス、GK(2004)。マイクロアレイ実験における差次的発現を評価するための線形モデルと経験的ベイズ法。遺伝学および分子生物学における統計的応用第3巻第1号第3条
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.