数値の結果を持つ長期データの場合、スパゲッティプロットを使用してデータを視覚化できます。たとえば、次のようなもの(UCLA Statsサイトから取得):
tolerance<-read.table("http://www.ats.ucla.edu/stat/r/faq/tolpp.csv",sep=",", header=T)
head(tolerance, n=10)
interaction.plot(tolerance$time, tolerance$id, tolerance$tolerance,
xlab="time", ylab="Tolerance", legend=F)
しかし、私の結果がバイナリ0または1の場合はどうなりますか?たとえば、Rの「ohio」データでは、バイナリの「resp」変数が呼吸器疾患の存在を示しています。
library(geepack)
ohio2 <- ohio[2049:2148,]
head(ohio2, n=12)
resp id age smoke
2049 1 512 -2 1
2050 0 512 -1 1
2051 0 512 0 1
2052 0 512 1 1
2053 1 513 -2 1
2054 0 513 -1 1
2055 0 513 0 1
2056 1 513 1 1
2057 1 514 -2 1
2058 0 514 -1 1
2059 0 514 0 1
2060 1 514 1 1
interaction.plot(ohio2$age+9, ohio2$id, ohio2$resp,
xlab="age", ylab="Wheeze status", legend=F)
スパゲッティプロットは見栄えがよくなりますが、あまり有益ではなく、あまりわかりません。この種のデータを視覚化する適切な方法は何でしょうか?たぶん、y軸に確率値が含まれているものでしょうか。
ohio
データがありません(2.15)(少なくともベースの一部として)。新しいバージョンですか、それとも他のライブラリですか?これは、Y軸に個人、X軸に結果を含むヒートマップの興味深いアプリケーションであり、1つの応答を黒、0の応答を白としてプロットします。行列を並べ替えると、さまざまなパターンがどのように蔓延しているかの概要がわかります。
geepack
パッケージの中にあることがわかりました。