すでにログ変換されているDVで、LOGリンク機能を備えたGLM正規分布を使用できますか?
はい; そのスケールで仮定が満たされている場合
正規分布を使用して正当化するには、分散均一性検定で十分ですか?
分散の平等が正常を意味するのはなぜですか?
残差チェック手順は、リンク関数モデルの選択を正当化するために正しいですか?
ヒストグラムと適合度検定の両方を使用して、仮定の適合性をチェックすることに注意する必要があります。
1)正常性を評価するためにヒストグラムを使用することに注意してください。(こちらもご覧ください)
つまり、ビン幅の選択を少し変更するだけの単純なもの、またはビンの境界の位置によっては、データの形状の印象がまったく異なる可能性があります。
これは、同じデータセットの2つのヒストグラムです。複数の異なるビン幅を使用すると、印象がそれに敏感であるかどうかを確認するのに役立ちます。
2)正規性の仮定が妥当であると結論付けるために、適合度テストを使用することに注意してください。正式な仮説テストは、実際には正しい質問に答えません。
たとえば、項目2 のリンクを参照してください。こちら
分散については、類似のデータセットを使用したいくつかの論文で「分布には均一な分散があったため、ガウス分布のGLMが使用された」と述べられています。これが正しくない場合、配布を正当化または決定するにはどうすればよいですか?
通常の状況では、質問は「私のエラー(または条件付き分布)は正常ですか?」-彼らはそうしません、私たちもチェックする必要はありません。より適切な質問は、「存在する非正規性の程度が私の推論にどの程度悪影響を及ぼすか」です。
カーネル密度推定または通常のQQplot(残差のプロット対通常のスコア)をお勧めします。分布がかなり正常に見える場合、心配する必要はほとんどありません。実際、たとえそれが明らかに正常でない場合でも、何をしたいかによっては、それほど問題にならない場合もあります(たとえば、通常の予測間隔は実際には正規性に依存しますが、他の多くのことは大きなサンプルサイズで機能する傾向があります)
おかしなことに、大きなサンプルでは、正常性は一般に次第に重要度が低くなります(前述のPIは別として)が、正常性を拒否する能力はますます大きくなります。
編集:分散の同等性に関するポイントは、サンプルサイズが大きい場合でも、推論に実際に影響を与える可能性があることです。しかし、おそらく仮説検定によってそれを評価すべきではありません。分散の仮定を誤って取得することは、想定される分布が何であれ、問題です。
私は、モデルのスケーリングされた逸脱度がNp前後である必要があることを読みました。
正規モデルに適合させると、スケールパラメーターが含まれます。この場合、分布が正規でない場合でも、スケーリングされた逸脱度は約Npになります。
あなたの意見では、ログリンク付きの正規分布が良い選択です
何を測定しているのか、または推論を何に使用しているのかがわからないまま、GLMに別の分布を提案するかどうかや、推論にとって正規性がどれほど重要であるかを判断できません。
ただし、他の仮定も妥当である場合(分散の線形性と等価性を少なくとも確認し、依存関係の潜在的な原因を検討する必要があります)、ほとんどの状況で、CIの使用や係数またはコントラストのテストの実行などは非常に快適です。 -これらの残差には歪度のごくわずかな印象しかありません。それが実際の効果であっても、これらの種類の推論には実質的な影響はありません。
要するに、あなたは大丈夫です。
(別の分布とリンク関数は、適合の点で少し良くなるかもしれませんが、制限された状況でのみ、それらはより意味をなす可能性があります。)