回答:
これは、回帰分析を行うときに最も難しい部分の1つだと思います。また、私はほとんどの解釈と格闘しています(特に二項診断はおかしいです!)。
私はこの記事につまずい http://www.r-bloggers.com/model-validation-interpreting-residual-plots/ もリンクされ http://statmaster.sdu.dk/courses/st111/module04/index.html #SECTION00020000000000000000
私に最も役立つのは、残差対モデルに含まれるおよび含まれないすべての予測パラメーターをプロットすることです。これは、多重共直線性の理由で事前にドロップされたものも意味します。この箱ひげ図では、条件付き散布図と通常の散布図が優れています。これは、起こりうるエラーを見つけるのに役立ちます
「Forest Analytics with R」(UseRシリーズ)には、混合効果モデル(およびglms)の残差を解釈する方法についての適切な説明があります。よく読んでください!http://www.springer.com/statistics/life+sciences,+medicine+%26+health/book/978-1-4419-7761-8
いつか前に、ユーザーが「大丈夫」と「大丈夫でない」と投票できる残留パターンを収集できるウェブサイトについて考えました。しかし、私はそのウェブサイトを見つけたことがありません;)
次の方法をお勧めします。
Buja, A., Cook, D. Hofmann, H., Lawrence, M. Lee, E.-K., Swayne, D.F and Wickham, H. (2009) Statistical Inference for exploratory data analysis and model diagnostics Phil. Trans. R. Soc. A 2009 367, 4361-4383 doi: 10.1098/rsta.2009.0120
いくつかの異なるアイデアがありますが、それらは主に、真の関係が何であり、その関係が実際のデータの分析に基づいていることを知っているデータのシミュレーションに帰着します。次に、実際のデータの診断と、シミュレートされたデータセットの診断を比較します。vis.test
RのTeachingDemosパッケージの関数は、論文の提案の1つのバリエーションを実装します。理解を深めるために、論文全体を読んでください(私の短い要約だけではありません)。
この質問は非常に古いものですが、最近ではDHARMa Rパッケージを使用して、任意のGL(M)Mの残差を標準化された空間に変換できるため、追加すると便利だと思いました。これが完了すると、通常の方法で、分布からの偏差、予測子への残留依存性、不均一分散または自己相関などの残留問題を視覚的に評価/テストできます。作業例については、パッケージビネットを参照してください。また、CVに関するその他の質問はこちらとこちらをご覧ください。