マクファデンの疑似R2解釈


29

支払い(1 =支払い、0 =支払いなし)と呼ばれる従属変数を持つMcFaddenの疑似R-2乗0.192のバイナリロジスティック回帰モデルがあります。この擬似R-2乗の解釈は何ですか?

ネストされたモデルの相対比較ですか(たとえば、6変数モデルのMcFaddenの疑似R-2乗は0.192ですが、5変数モデル(前述の6変数モデルから1つの変数を削除した後)、この5変数モデルには疑似R 0.131の2乗。モデルにその6番目の変数を保持しますか?または絶対量です(たとえば、McFaddenの擬似Rが0.192の特定のモデルは、McFaddenの擬似を持つ既存のモデルよりも優れています) 0.180のR二乗(ネストされていないモデルでも)?これらはMcFaddenの擬似R二乗を見るための単なる可能な方法です;しかし、私はこれらの2つのビューが道を外れていると仮定しているため、ここでこの質問をしています。

私はこのトピックについて多くの研究を行ってきましたが、McFaddenの疑似R 2乗0.192を解釈できるという観点で、私が探している答えをまだ見つけていません。洞察や参考文献は大歓迎です!この質問に答える前に、これがロジスティック回帰モデルを説明するのに最適な尺度ではないことを認識していますが、この統計をより深く理解したいと思います!

回答:


34

だから、私はマクファーデンの疑似R2について学んだことを適切な答えとして要約すると思いました。

McFaddenの疑似R2について確認できる参考文献は次のとおりです。McFadden、D.(1974)「質的選択行動の条件付きロジット分析」。P. Zarembka(ed。)の105-142、計量経済学のフロンティア。アカデミックプレス。http://eml.berkeley.edu/~mcfadden/travel.html 図5.5は、rho-squaredとOLSの従来のR2メジャーの関係を示しています。私の解釈では、rho-squared(McFaddenの擬似R2)の値が大きいほど、小さい値よりも優れているということです。

0.2〜0.4のMcFaddenの疑似R2の解釈は、彼が貢献した本の章から来ています:Bahvioural Travel Modelling。David HensherとPeter Stopherにより編集。1979年。マクファデンはCh。15「個人の旅行行動を分析するための定量的方法:最近のいくつかの進展」。(多項ロジットモデルのコンテキストでの)モデル評価の議論は、306ページで始まり、rho-squared(McFaddenの疑似R2)を紹介します。McFadden氏は、「R2インデックスはOLSを経験したプランナーにとってより馴染みのある概念ですが、ML推定ではロー2乗メジャーほど振る舞いません。ロー2乗に慣れていない人は、その値がR2インデックスの値よりもかなり低くなります。たとえば、ロー2乗の0.2〜0.4の値は、優れた適合を表します。

したがって、基本的には、rho-squaredはR2のように解釈できますが、それほど大きくなるとは思わないでください。そして、0.2-0.4の値は(McFaddenの言葉で)優れたモデル適合を示します。


まとめ、クリス。ご尽力ありがとうございました!
マットライヘンバッハ

13

McFaddenのRの2乗は1-l_mod / l_nullとして定義されます。l_modは近似モデルの対数尤度値、l_nullは予測子として切片のみを含むnullモデルの対数尤度です(したがって、すべての個体は同じ確率で予測されます) 「成功」の)。

ロジスティック回帰モデルの場合、対数尤度値は常に負です(各観測値からの尤度の寄与は0〜1の確率であるため)。モデルが実際に結果をnullモデルよりもうまく予測しない場合、l_modはl_nullよりも大きくないため、l_mod / l_nullは約1であり、McFaddenのRの2乗は0に近くなります(モデルには予測値がありません) 。

逆に、モデルが本当に良かった場合、成功(1)の結果を持つ人は1に近い適合確率を持ち、失敗(0)の結果を持つ人はその可能性が逆になります。この場合、尤度計算を行うと、モデルの各個人からの尤度の寄与はゼロに近くなり、l_modはゼロに近く、McFaddenのR 2乗は1に近く、非常に優れた予測能力を示します。

良い値と考えられるものに関して、私の個人的な見解では、統計における同様の質問(例えば、大きな相関関係を構成するものは何ですか?)のように、それは決定的な答えになることはありません。昨年、McFaddenのRの2乗ロジスティック回帰に関するブログ記事を書きました。これには、さらにいくつかのシミュレーション図があります。


5

このトピックに焦点を絞った研究をいくつか行ったところ、マクファデンの疑似R 2乗(尤度比インデックスとも呼ばれる)の解釈が明確ではないことがわかりました。ただし、0〜1の範囲で指定できますが、計算の結果として1に達することはありません。

私が非常に役立つとわかった経験則は、マクファデンの擬似R 2乗が0.2から0.4の範囲であると、モデルの適合が非常に良好であることを示します。したがって、上記のMcFaddenの疑似R 2乗が0.192であるモデルは、少なくともこのメトリックではひどいモデルではない可能性がありますが、それほど強力でもありません。

また、McFaddenの疑似R-2乗は、同じモデル(ネストされたモデル)の異なる仕様を比較するのに最適であることに注意することも重要です。前述の例を参照すると、6変数モデル(McFaddenの擬似R 2乗= 0.192)は、対数尤度比検定を使用して正式にテストした5変数モデル(McFaddenの擬似R 2乗= 0.131)よりもデータに適合します。 、2つのモデル間に有意差(p <0.001)があることを示します。したがって、指定されたデータセットには6変数モデルが優先されます。


1
McFaddenの0.2〜0.4のR2が「非常に良い」適合であると主張する、あなたが見つけた参考文献は何ですか?
クリス

ところで...ここに彼が彼の疑似R2測定を定義する元のマクファデンの記事への参照とリンクがあります。McFadden、D.(1974)「定性的な選択行動の条件付きロジット分析。」Pp。P. Zarembka(ed。)の105-142、計量経済学のフロンティア。アカデミックプレス。elsa.berkeley.edu/reprints/mcfadden/zarembka.pdf
クリス・

1
参照していただきありがとうございます。McFaddenの作品の多くは、彼のBerkeley Webサイトで見つけることができるようです。以下に、上記の書籍全体へのリンクを示します。elsa.berkeley.edu / users / mcfadden / travel.htmlすべての章はPDFとして表示されます。ロー2乗(McFaddenの疑似R2)については、第5章で説明します(122ページ以降)(式5.33およびその後すぐに続くグラフを参照)。0.2-0.4 = "VG model fit"という言及は見当たりません。この「経験則」の独創的な外観を探し続けます。ご協力いただきありがとうございます!
クリス

1
問題ない!好奇心と徹底を感謝します。正確なフレーズはlifesciencesite.com/lsj/life1002/…で見つけることができます。著者は、「McFaddenの疑似r平方(ρ2)を使用した適合度は、モデル全体の適合に使用されます。モデルの非常に良好な適合を表すために、0.2〜0.4の値をとる必要があります(Louviere et al。、2000)。」
マットライヘンバッハ

4
私の機関には、ルーヴィエールら(2000)の電子コピーがあります。「記載された選択方法:分析とアプリケーション」。ケンブリッジ大学出版局。これは、Lee(Life Science Journal)が{0.2-0.4} = "VG fit"のrho-squaredを引用している参考文献です。Louviereの55ページ(式3.32に関連)には、次の引用があります。「0.2-0.4のロー2乗値は、非常に良好なモデル適合を示すと考えられます。DomenichとMcFadden(1975)によるシミュレーションは、線形関数の場合は0.7〜0.9」。
クリス

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.