1
完全分離の問題をどのように説明して提示するか?
ロジスティック回帰との仕事は完全な分離の問題に精通している人々 :あなたは2つの結果の一つだけに関連付けられているの変数の特定の値を持っている場合(バイナリが言う持つすべての観測よう、X = 1が持っている結果= 1 )、可能性が爆発し、最尤推定値が無限大になります。Rでは、完全な予測/分離以外の理由で完全な予測エラーメッセージが表示される可能性があるため、これを非常にうまく処理できる場合とそうでない場合があります。Stataでは、そのような変数と問題のある値を識別し、それらを分析から破棄します。バツxxx = 1x=1x=1glmlogit 私の質問は、あなたが完全に分離している場合に何をすべきかとは異なります。変数を再コード化することで処理できること(変数はすべてカテゴリなので、単純にカテゴリを組み合わせることができます)。 代わりに、これを説明する一般的な方法は何でしょうか。私は約50%の割合が「陽性」である約100人の患者のデータセットを持っています。人口統計変数のいくつかのカテゴリは、この完璧な予測を生成します。7人すべての緑色の目の人々が「肯定的な」結果を持っているとだけ言いましょう。これは、サンプルサイズが1000で緑色の目が70人の場合に消える小さなサンプルの特徴かもしれませんが、臨床的に意味があるかもしれません。オッズ比が高い「ポジティブ」な結果。 したがって、ベイジアン法またはその他の収縮法を使用したと言ってもいいのですが、その方法を説明する際に、完全な予測/分離ができたことを認める必要があり、さらに高度な手法を見つけて結果を得る必要がありました。すべて。ここで使用するのに適した言語は何ですか?