nxm分割表の統計的検定


12

3つのグループの要素で構成されるデータセットがあります。それらをG1、G2、G3と呼びましょう。これらの要素の特定の特性を分析し、3つのタイプの「動作」T1、T2、およびT3に分けました(クラスター分析を使用してそれを行いました)。

したがって、3つのグループの要素の数をタイプ別に分割した、次のような3 x 3の分割表ができました。

      |    T1   |    T2   |    T3   |
------+---------+---------+---------+---
  G1  |   18    |   15    |   65    | 
------+---------+---------+---------+---
  G2  |   20    |   10    |   70    |
------+---------+---------+---------+---
  G3  |   15    |   55    |   30    |

これで、Rのこれらのデータに対してFisherテストを実行できます

data <- matrix(c(18, 20, 15, 15, 10, 55, 65, 70, 30), nrow=3)
fisher.test(data)

そして私は得る

   Fisher's Exact Test for Count Data

data:  data 
p-value = 9.028e-13
alternative hypothesis: two.sided     

だから私の質問は:

  • この方法でフィッシャーテストを使用するのは正しいですか?

  • 誰が誰と違うのか、どうやって知るのですか?使用できる事後テストはありますか?データを見ると、3 番目のグループは最初の2つのグループとは異なる動作をしていると思いますが、どのように統計的に表示しますか?

  • 誰かが私にロジットモデルを教えてくれました:彼らはこのタイプの分析のための実行可能なオプションですか?

  • このタイプのデータを分析する他のオプションはありますか?

本当にありがとうございます

ニコ

回答:


13

最初は、Fisherテストが正しく使用されていると思います。

カウントデータは、対数線形モデルを使用して適切に処理されます(ロジットではなく、適合値が下に制限されるようにします)。R family=poissonでは、(errors = Poissonおよびlink = logに設定する)を指定できます。ログリンクは、すべての近似値が正であることを保証します。一方、ポアソンエラーは、データが整数であり、平均と等しい分散を持っているという事実を考慮します。たとえばglm(y~x,poisson)、モデルにログリンクとポアソンエラーが適合しています(非正規性を説明するため)。

過分散がある場合(ポアソン誤差の仮定が適切な場合、残差は残差自由度と等しくなければなりません)、quasipoissonエラーファミリとして使用する代わりに、負の二項モデルを近似できます。(これにはglm.nbpackage の関数が含まれますMASS

あなたの場合、次のようなコマンドを使用してモデルを適合および比較できます。

observed <- as.vector(data)
Ts<-factor(rep(c("T1","T2","T3"),each=3))
Gs<-factor(rep(c("G1","G2","G3"),3))

model1<-glm(observed~Ts*Gs,poisson)

#or and a model without the interaction terms
model2<-glm(observed~Ts+Gs,poisson)


#you can compare the two models using anova with a chi-squared test
anova(model1,model2,test="Chi")
summary(model1)

最小モデルに迷惑変数がすべて含まれていることを常に確認してください。

誰が誰と違うかをどのように知るかについては、あなたを助けるかもしれないいくつかのプロットがあります。R関数assocplotは、2次元分割表の行と列の独立性からの偏差を示す関連プロットを生成します。

これは、モザイクプロットとしてプロットされた同じデータです。

mosaicplot(data, shade = TRUE)

ありがとう、それはまさに私が必要としたものです。私はあなたが過剰分散について話すときあなたが何を意味するのか完全にはわかりません(申し訳ありませんが、私は統計学者ではないかもしれません、多分それは非常に基本的なものです)...あなたは残留偏差が残留自由度に等しくなければならないと言います...どうすれば確認できますか?
ニコ

あなたが与えるsummary(model1)場合のようなものが表示されますResidual deviance: -2.7768e-28 on 0 degrees of freedom
ジョージドンタス

4

あなたは使用することができますmultinom多項回帰のためNNETパッケージから。事後テストでは、カーパッケージのlinearHypothesisを使用できます。linearHypothesis(ワルドテスト)またはanova(LRテスト)を使用して独立性テストを実施できます。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.