分割表のベイジアン分析:効果サイズの記述方法


9

私は、KruschkeのDoing Bayesian Data Analysisの例、特にch。のポアソン指数ANOVAに取り組んでいます。22、彼は分割表の独立性の頻出カイ二乗検定の代替として提示します。

変数が独立している場合(つまり、HDIがゼロを除外する場合)に予想されるよりも多かれ少なかれ頻繁に発生する相互作用に関する情報を取得する方法を確認できます。

私の質問は、このフレームワークでエフェクトサイズをどのように計算または解釈できるかです。たとえば、クルシュケは「青い目と黒い髪の組み合わせは、目の色と髪の色が独立している場合に予想されるよりも頻度が低い」と書いていますが、その関連付けの強さをどのように説明できますか?どの相互作用が他の相互作用よりも極端かを知るにはどうすればよいですか?これらのデータのカイ2乗検定を行った場合、全体的な効果の大きさの尺度としてCramérのVを計算できます。このベイジアンコンテキストでエフェクトサイズを表現するにはどうすればよいですか?

これは、本からの自己完結型の例です(でコード化R)。答えがはっきり見えて私から隠されている場合に備えて...

df <- structure(c(20, 94, 84, 17, 68, 7, 119, 26, 5, 16, 29, 14, 15, 
10, 54, 14), .Dim = c(4L, 4L), .Dimnames = list(c("Black", "Blond", 
"Brunette", "Red"), c("Blue", "Brown", "Green", "Hazel")))

df

         Blue Brown Green Hazel
Black      20    68     5    15
Blond      94     7    16    10
Brunette   84   119    29    54
Red        17    26    14    14

これは、効果の大きさの測定値(本には含まれていません)を含む、頻出主義者の出力です。

vcd::assocstats(df)
                    X^2 df P(> X^2)
Likelihood Ratio 146.44  9        0
Pearson          138.29  9        0

Phi-Coefficient   : 0.483 
Contingency Coeff.: 0.435 
Cramer's V        : 0.279

次に、HDIとセル確率(本から直接)を使用したベイジアン出力を示します。

# prepare to get Krushkes' R codes from his web site
Krushkes_codes <- c(
  "http://www.indiana.edu/~kruschke/DoingBayesianDataAnalysis/Programs/openGraphSaveGraph.R", 
  "http://www.indiana.edu/~kruschke/DoingBayesianDataAnalysis/Programs/PoissonExponentialJagsSTZ.R")

# download Krushkes' scripts to working directory
lapply(Krushkes_codes, function(i) download.file(i, destfile = basename(i)))

# run the code to analyse the data and generate output
lapply(Krushkes_codes, function(i) source(basename(i)))

そして、これはデータに適用されたポアソン指数モデルの事後のプロットです:

ここに画像の説明を入力してください

そして、推定された細胞確率に対する事後分布のプロット:

ここに画像の説明を入力してください

回答:


1

インデックスによると、Kruschkeは効果のサイズを2回だけ言及し、両方の時間はメトリック予測変数のコンテキストにあります。しかし、pにはこのビットがあります。601:

βrc

β1,2Sβ1,2x1,2yiPois(λi)λi=eβ1,2x1,2+S=eβ1,2x1,2eSx1,2λieβ1,2


1

ANOVAモデルの効果サイズを調べる1つの方法は、「超母集団」と「有限母集団」の標準偏差を調べることです。双方向テーブルがあるので、これは3つの分散成分(2つの主効果と1つの交互作用)です。これはmcmc分析に基づいています。各mcmcサンプルの各効果の標準偏差を計算します。

sk=1dk1j=1dk(βk,jβ¯k)2

kskk

アンドリューゲルマンはこのアプローチを提唱しました。彼の2005年の論文「分散分析:なぜそれがかつてないほど重要であるのか」を参照してください。


その論文はこちらから入手できます
Seanイースター

これらの回答はどちらも非常に有望なようです。Rそれがどのようにプログラムされるかを示すのに十分知っている人はいますか?
Ben

@seaneaster-リンクを追加していただきありがとうございます。@ben、これらの計算はRでは単純です。しかし、サンプルがどのような形式になっているかはわかりません。sd ()「適用」関数の1つと組み合わせて使用できるはずです。ボックスプロットに関しては、これらはで基本的なものを取得するのが簡単boxplot ()です。
確率

おかげで、私の質問のサンプルデータとコードを使用してデモンストレーションできますか?
ベン・

要するに、あなたが投稿したコードが理解できないからです。データがどのように構成されているのかわかりません。そして私が言ったように、これはあなた自身で行うのは難しい分析ではありません。このアプローチは、単純なメジャー(標準偏差)を計算しています。さらに、Rコーディングは質問の一部ではありません-分割表分析を要約する方法について質問しました。
確率
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.