ロジットの線形性の違反に対するロジスティック回帰のロバスト性の調査


10

バイナリの結果(開始と開始ではない)でロジスティック回帰を行っています。私の予測因子の組み合わせは、すべて連続変数または二分変数です。

Box-Tidwellアプローチを使用すると、私の連続予測子の1つがロジットの線形性の仮定に違反する可能性があります。適合度の統計から、適合度に問題があるという兆候はありません。

その後、元の連続変数を次のように置き換えて、回帰モデルを再度実行しました。1つ目は平方根変換、2つ目は変数の二分法バージョンです。

出力を調べると、適合度はわずかに向上しているようですが、残差が問題になります。パラメータ推定値、標準誤差、およびは比較的似ています。データの解釈は、3つのモデル間で私の仮説の観点からは変わりません。exp(β)

したがって、私の結果の有用性とデータの解釈の観点から、元の連続変数を使用して回帰モデルを報告するのが適切なようです。

私はこれを思っています:

  1. ロジスティック回帰は、ロジット仮定の線形性の潜在的な違反に対して堅牢なのはいつですか?
  2. 上記の例を考えると、元の連続変数をモデルに含めることは許容できると思われますか?
  3. モデルがロジットの線形性の潜在的な違反に対してロバストであることを受け入れることが十分である場合に推奨するためのリファレンスまたはガイドはありますか?

回答:


16

線形性の仮定は、回帰では一般に違反しているため、仮定ではなくサプライズと呼ぶ必要があります。他の回帰モデルと同様に、線形性を誤って想定した場合、ロジスティックモデルは非線形性に対してロバストではありません。残差やオムニバス適合度テストを使用して非線形性を検出するのではなく、直接テストを使用することをお勧めします。たとえば、回帰スプラインを使用して連続予測子を展開し、すべての非線形項の複合テストを実行します。条件をテストせず、非線形性を期待するほうがよいでしょう。このアプローチは、平方根、対数などのさまざまな単一勾配の変換を試すよりもはるかに優れています。これは、分子の自由度が十分に大きくないため、このような分析が正しくない場合に統計的推論が生じるためです。

これがRの例です。

require(rms)
f <- lrm(y ~ rcs(age,4) + rcs(blood.pressure,5) + sex + rcs(height,4))
# Fits restricted cubic splines in 3 variables with default knots
# 4, 5, 4 knots = 2, 3, 2 nonlinear terms
Function(f)   # display algebraic form of fit
anova(f)      # obtain individual + combined linearity tests

あなたの答えは素晴らしい意味があります-ありがとう!SPSSで使用する構文を提案できますか?私は残念ながらRを利用するためにアクセス(またはスキル)を持っていない
ショートエリザベス

1
Rを学ぶ時間は間違いなく価値があり、ロジスティックモデリングとrmsパッケージに関連する多くの配布資料があります。これはSPSSでは困難です。
フランクハレル2013年

@FrankHarrell:このf <- lrm(y ~ ...行はエラーになりますobject 'y' not found-修正できますか?
arielf 2013

1
それは私のrmsパッケージに固有ではない非常に基本的なRエラーです。基本的な回帰lm関数に利用できる広範な資料から始めて、Rを理解するために少し時間をかけてください。
フランクハレル2013

1
ソフトウェアのヘルプページに組み込まれている例は、そのようなデータをシミュレートしているので、全体の例を見てください。行いrequire(rms)、その後?lrm、次にexamples(lrm)
フランク・ハレル
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.