私はA. Agresti(2007)、An Introduction to Categorical Data Analysis、2ndを読んでいます。版であり、この段落(p.106、4.2.1)を正しく理解しているかどうかはわかりません(ただし、簡単なはずです)。
前章のいびきと心疾患に関する表3.1では、254人の被験者が毎晩いびきを報告しており、そのうち30人が心疾患を患っていました。データファイルにグループ化されたバイナリデータがある場合、データファイルの行は、これらのデータをサンプルサイズ254のうち30例の心臓病として報告します。データファイルにグループ化されていないバイナリデータがある場合、データファイルの各行は、個別の主題なので、30行には心疾患の1が含まれ、224行には心疾患の0が含まれます。ML推定値とSE値は、どちらのタイプのデータファイルでも同じです。
グループ化されていないデータのセット(1つは依存、1つは独立)を変換すると、すべての情報を含めるのに「1行」以上かかることになります!?
次の例では、(非現実的な!)単純なデータセットが作成され、ロジスティック回帰モデルが構築されます。
グループ化されたデータは実際にはどのように見えますか(変数タブ?)グループ化されたデータを使用して同じモデルをどのように構築できますか?
> dat = data.frame(y=c(0,1,0,1,0), x=c(1,1,0,0,0))
> dat
y x
1 0 1
2 1 1
3 0 0
4 1 0
5 0 0
> tab=table(dat)
> tab
x
y 0 1
0 2 1
1 1 1
> mod1=glm(y~x, data=dat, family=binomial())