Rでは、348個の測定値のサンプルがあり、将来のテストのために正規分布であると仮定できるかどうかを知りたいです。
本質的に別のスタックの答えに続いて、私は密度プロットとQQプロットを見ています:
plot(density(Clinical$cancer_age))
qqnorm(Clinical$cancer_age);qqline(Clinical$cancer_age, col = 2)
私は統計に強い経験はありませんが、私が見た正規分布の例のように見えます。
次に、シャピロウィルクテストを実行しています。
shapiro.test(Clinical$cancer_age)
> Shapiro-Wilk normality test
data: Clinical$cancer_age
W = 0.98775, p-value = 0.004952
正しく解釈すれば、帰無仮説を拒否しても安全であることがわかります。これは、分布が正規であるということです。
ただし、2つのスタックポストに遭遇しました(こちら、およびこちら)にため、このテストの有用性が大きく損なわれています。サンプルが大きい場合(348は大きいと見なされますか?)、常に正規分布ではないと表示されます。
すべてをどのように解釈すればよいですか?QQプロットに固執し、分布が正規であると仮定する必要がありますか?