Hosmer-Lemeshowテストのの自由度


33

ロジスティック回帰モデルの適合度(GOF)に対するHosmer-Lemeshow検定(HLT)の検定統計量は、次のように定義されます。

その後、サンプルは単位、に分割され、十分位ごとに次の量が計算されます。d=10D1D2Dd

  • O1d=Ddy、すなわち、十分位数での陽性症例の観測数。Dd
  • O0d=Dd1y、すなわち、十分位数で観測された負のケースの数。Dd
  • E1d=Ddπ^、つまり十分位数陽性症例の推定数。Dd
  • E0d=Dd1π^、すなわち、十分位数負のケースの推定数。Dd

ここで、は番目の観測の観測されたバイナリ結果で、はその観測の推定確率です。yπ Iπ^

次に、検定統計量は次のように定義されます。

バツ2=h=01g=1dOhgEhg2Ehg=g=1dO1gngπ^gng1π^gπ^g2

ここで、π^gは十分位数gの平均推定確率でgあり、ng位数の企業数とします。

Hosmer-Lemeshow(このリンクを参照)によると、この統計には(特定の仮定の下で自由度(d-2)のχ2分布がありd2ます。

一方d行(10進に対応)および2列(true / falseバイナリ結果に対応)の分割表を定義する場合、この分割表のχ2テストのテスト統計上記で定義したX ^ 2と同じバツ2ですが、分割表の場合、この検定統計量はχ2d121=d1自由度です。それで、さらに1自由度

自由度の数のこの違いをどのように説明できますか?

編集:コメントを読んだ後の追加:

@whuber

彼らは(Hosmer DW、Lemeshow S.(1980)、多重ロジスティック回帰モデルの適合度検定を参照。Communicationsin Statistics、A10、1043-1069)ムーアとスプルイルによって証明された定理があると言う(1)グループ化されていないデータの尤度関数を使用してパラメーターを推定し、(2)2xgテーブルの頻度が推定パラメーターに依存する場合、つまり、セルがランダムであり、固定ではない場合、適切な規則性条件下で(1)および(2)の下の適合度統計は、推定されたパラメーターと加重カイ二乗変数の合計による自由度の通常の減少を伴う中央カイ二乗の統計です。

そして、彼らの論文をよく理解していれば、彼らはこの「補正項」の近似値を見つけようとします。それをよく理解していれば、カイ二乗確率変数のこの加重和であり、シミュレーションを行うことでこれを行いますが、彼らがそこで言っていることを私が完全に理解していないことを認めなければならないので、私の質問です。なぜこれらの細胞はランダムなのですか、それは自由度にどのように影響しますか?セルの境界を修正し、推定スコアに基づいて固定セルの観測値を分類した場合、セルの「内容」はランダムですが、セルはランダムではありませんか?

@フランク・ハレル:以下のコメントで言及しているHosmer-Lemeshowテストの「欠点」は、カイ二乗の加重和の近似の結果にすぎないのではないでしょうか?


9
本には、このテストの詳細な説明とその基礎が含まれています。あなたの質問はpp 145-149で完全に回答されています。テストで自由度を決定することは微妙なことです。これらのテストの大部分は(そもそも)近似であり、これらの近似は、一見マイナーな技術条件が適用される場合にのみ有効だからです。このすべての説明については、stats.stackexchange.com / a / 17148を参照してください。H&Lは純粋に実用的なルートを取りました。彼らは DFの推奨を「広範なシミュレーションセット」に基づいています。 D - 2χ2d2
whuber

4
このテストは現在、(1)電力不足、(2)連続確率のビニング、(3)ビニングの選択と十分位の定義の選択における意性のために、時代遅れと見なされています。Hosmer-le Cessie 1 dfテストまたはSpiegelhalterテストが推奨されます。たとえば、R rmsパッケージresiduals.lrmval.prob関数を参照してください。
フランクハレル

2
@フランク・ハレル:(a)Hosmer-Lemeshowテストは時代遅れです、との違いを理解することはまだ興味深いと思います、そして(b)Spiegelhalterテストがより強力であることを示す参照がありますかHosmer-Lemeshowテスト?χ2

2
これらの問題は、元の質問と比較して非常に小さいです。
フランクハレル

3
詳細はこのサイトの他の場所にあると思います。簡単に説明すると、(1)Hosmerはテストがtest意的であることを示しました-正確にどのように10進が計算されるかに非常に敏感です。(2)力が不足している。(滑らかな検量線とは対照的に)ビニングされた検量線をプロットし、ジャンプに注目すると、不正確な量に基づいていることがわかります。また、極端な過剰適合に対して適切にペナルティを科すことはありません。
フランクハレル

回答:


2

Hosmer DW、Lemeshow S.(1980)、多重ロジスティック回帰モデルの適合度テスト。Communications in Statistics、A10、1043-1069、次のことを示しています。

モデルがロジスティック回帰モデルであり、パラメーターが最尤法で推定され、グループが推定確率で定義されている場合、は漸近的に (Hosmer、Lemeshow、1980、p.1052、Theorem 2)。G X 2 χ 2G - P - 1 + Σ P + 1pGX2χ2(Gp1)+i=1p+1λiχi2(1)

(注:必要な条件は、1052ページの定理2には明示されていませんが、注意して論文と証明を読むとポップアップします)

2番目の項は、グループ化が推定-すなわちランダム-量(Hosmer、Lemeshow、1980、p。 1051)i=1p+1λiχi2(1)

シミュレーションを使用して、2番目の項は(シミュレーションで使用される場合)近似できることを示しました (Hosmer、Lemeshow、1980、p.1060)χ2(p1)

これら2つの事実を組み合わせると、2つの変数の合計が得られます。1つは自由度、もう1つは 自由度または G - P - 1 、P - 1 X 2χ 2G - P - 1 + P - 1 = G - 2 χ2Gp1p1X2χ2(Gp1+p1=G2

したがって、質問に対する答えは、「重み付きカイ二乗項」の発生、またはグループがそれ自体ランダム変数である推定確率を使用して定義されるという事実にあります。

Hosmer Lemeshow(1980)Paper-Theorem 2も参照してください


加重カイ二乗用語「の発生における質問に対する答え嘘だから、 『』グループがランダム変数自身と推定確率を使用して定義されているという事実で」。A)推定確率により、p + 1の追加の削減が得られます。これにより、分割表(g項のみが推定される)の場合と主な違いが生じます。B)推定値は尤度推定値でも等しく効率的でもないため、重み付きカイ2乗項は補正として発生します。これにより、削減の効果が(p + 1)よりも少なくなります。
セクストゥスエンピリカス

@Martijn Weterings:このコメントであなたが言うことは、あなたが答えで言うこととまったく同じ説明ではない(完全に異なると言うのではない)と結論づけてもいいですか?あなたのコメントは、dfがあるという結論に至り ますか?G2

私の答えは、「この分割表の検定の検定統計量」に基づく推論と比較した自由度の違いの背後にある直観を説明しそれらが異なる理由を説明します(固定セルを推定する場合)。これは、dfがG-3であると結論付ける「通常の削減」に焦点を当てています。ただし、「通常の削減」の特定の条件は満たされていません。このため(ランダムセル)、重み付きカイ二乗項を修正として使用してより複雑な項を取得し、事実上G-2になります。完全に異なるとはほど遠い。χ2
セクストゥスエンピリカス

@ Martijn Weterings、申し訳ありませんが、私はあなたの答えに「ランダムセル」のような概念がまったくないので、私は賛成できません、あなたのすべてのあなたの素敵な写真を意味しますか? 「ランダムセル」についての何か、または私の答えを読んだ後にその概念を思いついたのですか?

ごめんなさい。私の答えは、HLテストの自由度を正確に示す正確な答えではないことに同意します。私はそのため申し訳ありません。持っているのは、続くChernoff Lehman統計(ランダムセルも含む)です分布。現在、どの部分があなたを悩ませているのかははっきりしていませんが、この点でより建設的になれることを願っています。すべて説明したい場合は、そのための記事が既にあります。私の答えは、コンティンジェンシーテーブルテストとの主な違いを説明する取り組みました。Σ K - S - 1 iは= 1 χ 21 i=1ks1χ21+=ksk1λχ21=1ks1χ21
セクストゥスエンピリカス

2

あなたが参照する定理(通常の減少部分「推定されたパラメータによる自由度の通常の減少」)は、RA Fisherによって主に提唱されています。「分割表からのカイ二乗の解釈とPの計算」(1922)で規則を使用し、「回帰式の適合度」 1922)彼は、データから期待値を得るために回帰で使用されるパラメーターの数だけ自由度を減らすと主張します。(1900年に導入されてから20年以上、人々が誤った自由度でカイ二乗検定を誤用していることに注意するのは興味深いことです)R1C1

あなたのケースは第2種(回帰)であり、前の種(コンティンジェンシーテーブル)ではありませんが、2つはパラメーターの線形制限であるという点で関連しています。

観測値に基づいて期待値をモデル化し、2つのパラメーターを持つモデルでこれを行うため、自由度の「通常の」減少は2プラス1(O_iは合計は別の線形制限であり、モデル化された期待値の「非効率」のために、3ではなく2の削減に効果的になります)。


カイ2乗検定は、結果が期待されるデータにどれだけ近いかを表す距離尺度としてを使用します。カイ2乗検定の多くのバージョンでは、この「距離」の分布は正規分布変数の偏差の合計に関連しています(これは限界にのみ当てはまり、非正規分布データを扱う場合の近似です) 。χ2

多変量正規分布のための密度関数に関連するによってχ2

fバツ1バツk=e12χ22πk|Σ|

の共分散行列の行列バツ|Σ|バツ

およびはマハラノビス場合、ユークリッド距離に減少する距離。 Σ = Iχ2=バツμTΣ1バツμΣ=

1900年の記事で、ピアソンはレベルは回転楕円体であり、などの値を積分するために球面座標に変換できると主張しました。これは単一の積分になります。 P χ 2 > A χ2Pχ2>a


この幾何学的表現、距離としてのおよび密度関数の項は、線形制限が存在する場合の自由度の低下を理解するのに役立ちます。χ2

まず、2x2分割表の場合。4つの値は4つの独立した正規分布変数ではないことに注意してください。代わりに、それらは互いに関連しており、1つの変数に要約されます。OEE

テーブルを使用しましょう

Oj=o11o12o21o22

その後、期待値

Ej=e11e12e21e22

固定されている場合、は4自由度のカイ2乗分布として分布しますが、はで、バリエーションは4つの独立変数のようではありません。代わりに、と違いはすべて同じであることがわかります eijoojejejej oeojoe

o11e11=o22e22=o21e21=o12e12=o11o11+o12o11+o21o11+o12+o21+o22

そして、それらは事実上4つではなく単一の変数です。幾何学的には、これは4次元の球ではなく、単一の線で統合された値として見ることができます。χ2

この分割表テストは、Hosmer-Lemeshowテストの分割表の場合ではないことに注意してください(別の帰無仮説を使用します!)。Hosmer and Lemshowの記事のセクション2.1「およびが既知の場合」も参照してください。その場合、(R-1)(C-1)ルールのようにg-1の自由度ではなく、2g-1の自由度が得られます。この(R-1)(C-1)ルールは、行変数と列変数が独立しているという帰無仮説(具体的には、値にR + C-1制約を作成する)の場合です。Hosmer-Lemeshow検定は、基づくロジスティック回帰モデルの確率に従ってセルが満たされるという仮説に関連しています。β _ O I - E I Fβ0β_oefoあなたはr分布仮定A の場合のパラメーターおよび分布仮定Bの場合のパラメーターp+1

第二に、回帰の場合。回帰は、分割表として差分似た処理を行い、バリエーションの次元を減らします。値はモデル項と残差(誤差ではない)項の合計として表すことができるため、これには素敵な幾何学的表現があります。これらのモデル項と残差項はそれぞれ、互いに垂直な次元空間を表します。つまり、残差の項は可能な値を取ることができません!つまり、モデルに投影される部分、およびモデル内の各パラメーターのより具体的な1次元によって削減されます。Y I β X Ioeyβバツϵϵ


次の画像が少し役立つかもしれません

以下は、二項分布からの400×3(非相関)変数です。これらは、正規分布変数ます。同じ画像にの等値面を描画します。(角度を変更しても密度は変更されないため)単一の積分のみが必要となるように球面座標を使用してこの空間で積分すると、はで、この部分はd次元球体の面積を表します。変数を制限する場合Bn=60p=1/62/63/6Nμ=npσ2=np1pχ2=126χ0ae12χ2χd1dχχd1χ 何らかの方法で、統合はd次元の球ではなく、より低い次元のものになります。

chi ^ 2のグラフィカルな表現

以下の画像を使用して、残差項の次元削減のアイデアを得ることができます。幾何学用語で最小二乗法を説明します。

青で測定値があります。赤でモデルが許可するものがあります。多くの場合、測定値はモデルと正確に等しくなく、多少の偏差があります。これは、幾何学的に、測定点から赤い表面までの距離と見なすことができます。

赤い矢印および値はおよびあり、x = a + b * z +エラーまたはmあなたは1mあなたは2111012

[バツ1バツ2バツ3]=a[111]+b[012]+[ϵ1ϵ2ϵ3]

したがって、これらの2つのベクトルおよび(赤い面)のスパンは、回帰モデルで可能なの値であり、は、観測値と回帰/モデル化された値。最小二乗法では、このベクトルは赤い表面に垂直です(最小距離は最小の二乗和です)(モデル化された値は観測値の赤い表面への投影です)。111012バツϵ

そのため、観測されたものと(モデル化された)期待されるものとのこの差は、モデルベクトルに垂直なベクトルの合計になります(この空間には、空間の合計からモデルベクトルの数を引いた次元があります)。

単純な例の場合。合計ディメンションは3です。モデルには2つのディメンションがあります。また、エラーの次元は1です(したがって、これらの青い点のどれをとっても、緑の矢印は単一の例を示し、エラー項は常に同じ比率を持ち、単一のベクトルに従います)。

回帰次元削減のグラフィカルな表現


この説明がお役に立てば幸いです。それは決して厳密な証明ではなく、これらの幾何学的表現で解決する必要がある特別な代数的トリックがあります。とにかく、私はこれらの2つの幾何学的な表現が好きです。1つは、球面座標を使用してを統合するピアソンのトリックであり、もう1つは、最小二乗和法を平面(またはより大きなスパン)への投影として表示するものです。χ2

私はいつもで終わることに驚いています。これは私の観点では、二項式の通常の近似はによるはなく、および分割表の場合は簡単に解決できますが、回帰または他の線形制限の場合はそれほど容易に解決しませんが、文献は「他の線形制限でも同じように解決する」と主張するのが非常に簡単です。(問題の興味深い例。次のテストを複数回実行すると、「コインを2回10回投げ、合計が10であるケースのみを登録する」場合、この「典型的なカイ2乗分布は得られません」単純な」線形制限)oeeenp1p


2
私の正直な意見では、この回答にはテストに関連する非常に良い数値と引数がありますが、ロジスティック回帰のHosmer-Lemeshowテストに関する質問とはあまり関係がありません。1つのパラメーターが推定される回帰について議論していますが、Hosmer-Lemeshowテストは、パラメーターが推定されるロジスティック回帰に関するものです。stats.stackexchange.com/questions/296312/…も参照してくださいχ2p>1

...そして、あなたが言うように、分母にがあり、ではないので、これはこの質問に答えません。したがって、申し訳ありませんが、グラフに投票する必要があります(ただし、グラフは非常に素晴らしいです。n p 1 p enp1p

「式または少なくとも「直観的な」説明を理解する」ためにコメントを求めていました。それが、これらの幾何学的解釈で得られるものです。正と負の両方のケースを追加した場合にこれらのどのようにキャンセルされるかを正確に計算することは、直感的ではなく、ディメンションを理解するのに役立ちません。np1p
セクストゥスエンピリカス

私の答えでは、典型的な自由度を使用し、1つのパラメーター(p = 1)で回帰が実行されたと仮定しましたが、これは間違いでした。参照内のパラメーターは、と 2つです。適切な条件(効率的な推定値)のみが満たされていれば、これらの2つのパラメーターは次元をd-3に減らしていました(たとえば、フィッシャーの素晴らしい記事を参照してください。 ')....d1pβ0β
セクストゥスエンピリカス

....とにかく、次元d-1を取得しない理由(そして、回帰に2つのパラメーターを入れた場合、代わりにd-3のようなものを期待する必要がある)と、効率的な推定による次元削減がどのように想像できるかを説明しました。その非効率性のために余分な用語(有効な自由度を潜在的に増加させる)を計算するのはムーア-シュプルールの記事であり、d-2が最適に動作することを示すのはHosmer-Lemeshowシミュレーションです。その理論的な作業は直感的ではなく、シミュレーションは正確ではありません。私の答えは、d-1との違いについての要求された説明です。
セクストゥスエンピリカス
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.