この問題はいつもitsい頭を抱えているようで、私は統計を自分自身で理解するために(そして正気!)首を切り落とそうとしています。
一般的な線形モデルの仮定(t検定、ANOVA、回帰など)には「正規性の仮定」が含まれますが、これが明確に記述されることはめったにありません。
私は、多くの場合、単に「正規性の仮定が」それぞれに適用されることを示す統計の教科書/マニュアル/などに遭遇グループ(すなわち、カテゴリX変数)、そして我々は我々が正常からの逸脱を調べる必要があり、各グループを。
質問:
仮定はY の値またはYの残差を参照していますか?
特定のグループでは、Y 値の強い非正規分布(たとえば、歪んだ)を持つことができますが、Y の残差のほぼ(または少なくともより正規の)分布ですか?
他の情報源は、仮定がモデルの残差に関するものであると説明しています(t検定/ ANOVAなどのグループがある場合)。これらの残差の正規性の逸脱を調べる必要があります(つまり、実行)。
以下のための残差の正規んモデルはのための残差の正規性を意味するものでグループを?言い換えれば、モデルの残差を調べるだけでよい(多くのテキストの指示に反する)。
これを状況に当てはめるために、この架空の例を考えてみましょう。
- 2つの母集団(X)間のツリーの高さ(Y)を比較します。
- 1つの母集団では、Yの分布は強く右に歪んでいます(つまり、ほとんどの木が短く、背が非常にわずかです)。
- 身長は、正規分布の母集団で全体的に高くなっています(「本当の」違いがある可能性を示唆しています)。
- データの変換は、最初の母集団の分布を実質的に改善しません。
まず、根本的に異なる高さ分布が与えられたグループを比較することは有効ですか?
ここで「正常性の仮定」にアプローチするにはどうすればよいですか?1つの母集団のリコールの高さは正規分布ではありません。両方の母集団の残差を個別に調べるか、モデルの残差を調べますか(t検定)?
返信で質問を番号で参照してください。経験により、人々は迷子になったり、簡単に追跡できたりすることがわかりました(特に私です!)。私は統計学者ではないことに注意してください。ただし、統計についてはかなり概念的な(つまり、技術的ではない!)理解があります。
PS、私はアーカイブを検索し、私の理解を強固にしていない次のスレッドを読みました。