非常に興味深い質問です。ここでそれを考えます。
情報のエンコードがすべてであり、次にベイジアンクランクを回します。それは本当であるには余りにも良いようです-しかし、これらの両方は彼らが思われるよりも難しいです。
私は質問をすることから始めます
多重比較について心配するとき、どのような情報が使用されていますか?
いくつかのことを考えることができます-最初は「データdr」です-十分な合格/不合格になるまで「すべて」をテストします(ほとんどすべての統計トレーニングを受けた人がこの問題にさらされると思います)。また、不吉な部分は少なくなりますが、基本的には「実行するテストが非常に多くあります。すべてが正しくないことは確かです」。
これについて考えた後、私が気づいたことの1つは、特定の仮説や特定の比較についてあまり耳にすることはないということです。それはすべて「コレクション」に関するものです-これは交換可能性に対する私の考えの引き金となります-比較される仮説は何らかの形で互いに「類似」しています。また、交換可能性をベイジアン分析にどのようにエンコードしますか?-超優先、混合モデル、ランダム効果など!!!
しかし、交換可能性は、そこへの道の一部に過ぎません。すべて交換可能ですか?または、「スパース性」がありますか-候補の大きなプールを持ついくつかの非ゼロ回帰係数など。混合モデルと正規分布のランダム効果はここでは機能しません。それらは、ノイズをつぶして信号に手をつけないままにする(たとえば、locationBとlocationCの "true"パラメーターを等しくし、locationA "true"パラメーターを任意に大きくまたは小さく設定し、標準線形混合モデルが失敗するのを見て) 。しかし、それは修正することができます-「スパイクとスラブ」の優先順位や「馬の靴」の優先順位など。
ですから、あなたが話している仮説の種類を説明し、既知の特徴を事前確率と尤度に反映させることについてです。Andrew Gelmanのアプローチは、広範なクラスの多重比較を暗黙的に処理する方法にすぎません。最小二乗および正規分布と同様に、ほとんどの場合(すべてではありませんが)うまく機能する傾向があります。
これを行う方法については、次のように推論する人を考えることができます-グループAとグループBは同じ平均を持っている可能性があります-私はデータを見て、平均が「近い」-したがって、より良い推定を得るためにどちらの場合も、最初の考えは同じ意味を持つため、データをプールする必要があります。-それらが同じでない場合、データはそれらが「近い」という証拠を提供するので、仮説が間違っていても「少し」プールすることはあまり私を傷つけません(すべてのモデルが間違っている、いくつかは有用です)
上記はすべて、「それらは同じである可能性がある」という前提に基づいていることに注意してください。それを取り除いてください、そしてプーリングの正当化はありません。おそらく、テストについての「正規分布」の考え方も見ることができます。「ゼロである可能性が最も高い」、「ゼロでない場合はゼロに近い可能性が高い」、「極端な値はほとんどありません」。この代替案を検討してください:
- グループAとグループBの平均は等しいかもしれませんが、大きく異なる可能性もあります
次に、「少し」プーリングについての議論は非常に悪い考えです。合計プーリングまたはゼロプーリングを選択することをお勧めします。コーシー、スパイク&スラブ、状況の種類(ゼロ付近の質量のロット、および極値の質量の多く)
ベイジアンのアプローチでは、事前および/または尤度に懸念を抱かせる情報が組み込まれているため、多重比較全体を処理する必要はありません。ある意味では、利用可能な情報を適切に考え、それを分析に含めるようにしてください。