ロジスティック回帰係数の分析


12

ロジスティック回帰係数のリストを次に示します(最初のものは切片です)

-1059.61966694592
-1.23890500515482
-8.57185269220438
-7.50413155570413
 0
 1.03152408392552
 1.19874787949191
-4.88083274930613
-5.77172565873336
-1.00610998453393

インターセプトが非常に低く、実際には0に等しい係数を持っているのがおかしいと思います。これをどのように解釈するかは完全にはわかりません。0は、特定の変数がモデルにまったく影響を与えないことを示していますか?しかし、自分の列を入力することによって作られるインターセプトは、突然本当に重要ですか?または、私のデータはただがらくたであり、モデルは適切に適合できません。


2
他の変数の範囲または標準偏差は?推定値がゼロの変数の標準偏差と他の変数との間に大きな差はありますか?標準偏差が他の標準偏差と比較して小さい場合、数値の係数はゼロになることがあります(数値精度)。また、インターセプトとは、基本的に、平均値が大きい(ゼロから離れている)変数があることを意味します。変数をセンタリングすると、より解釈可能なインターセプトが得られ、他の変数のベータは変更されません(反復アルゴリズムエラーは別として)。
確率論的

1
6番目の変数のすべての値から1027を引くと、切片は0に非常に近くなります。それで気分が良くなりますか?:-)
whuber

4
コンテキストがまったくないこのような係数のリストを表示することは、「ジョーには31が多いのではないでしょうか?」31 なんて言わずに。31台?たくさん。31人の子供?たくさんあります!31ドル?あまりない。
ピーターフロム-モニカの復職

1
ゼロの係数に関して:これは、ここに貼り付ける前にすべての係数をXLに入れることのアーティファクトとして発生する可能性があります。これらのXLセルの1つが整数に丸めてゼロを生成するように設定された可能性があります。このようなことが起こりました。
rolando2

ご意見をお寄せいただきありがとうございます!皆さん一人一人に本当に感謝しています!私の質問の多くが答えられた
-shiu6rewgu

回答:


16

私の意見では、あなたはコメントで非常に良い情報を得ています。ロジスティック回帰に関するいくつかの基本的な事実がこれらのことをより理解しやすくするのに役立つのではないかと思うので、それを念頭に置いて、いくつかのことを述べさせてください。ロジスティック回帰では、係数はロジスティックスケールに基づいています(そのため、名前は...)。観測値に共変量の値をプラグインし、それらを係数で乗算し、合計すると、ロジットが得られます。

logit=β0+β1x1+β2x2+...+βkxk
e2.718281828
e2=7.389056
7.3890561+7.389056=0.880797

9.8×103050/(1+0))、再び0を返します。したがって、出力が示すことは、すべての変数が0に等しい場合、イベント(それが何であれ)は単に発生しないということです。もちろん、それは私たちが話していることに依存しますが、私はあまり注目に値しませんこの。標準的なロジスティック回帰式(たとえば、二乗項なしなど)では、共変量と成功確率の関係が単調増加または単調減少であると必然的に想定しています。。つまり、常に大きくなります(または小さくなります)。したがって、一方向に十分に行けば、コンピューターは0以外の数字を伝えることができないほど小さい数字になります。獣の性質。偶然にも、モデルの場合、共変量の値が0に等しいところまで行きます。

係数0に関しては、あなたが提案するように、その変数は効果がないことを意味します。さて、変数が効果を持たないことは非常に合理的ですが、それでも、基本的に正確に0の係数を取得することはありません。コメントはいくつかの可能な提案を提供します。私は別のものを提供することができます、それはその変数に変化がないかもしれないということです。たとえば、性別をコーディングする変数があり、サンプルには女性のみが含まれている場合。それが本当の答えであるかどうかはわかりません(たとえば、R NAはその場合返されますが、ソフトウェアは異なります)。これは単なる別の提案です。


2
自然対数オッズに掛けることにより、10を底とするオッズを得ることができます。3067003746010460すべての共変量がゼロであるとき。
確率論的

10

インターセプトの解釈

ロジスティック回帰は、「1」になる事後確率を与えると考えることができます。切片は、データセットから派生したカテゴリーの事前分布を表します。具体的には、モデルに切片のみがある場合、log(p(Y = 1)/ p(Y = 0)の経験的推定値です。カテゴリ共変量がある場合の「参照」クラス、および共変量がより一般的に0である場合(ただし、解釈しにくい)ので、強い負の数は、おそらく、特徴づけられるサンプルのケースでは「1」それがインターセプト値を心配する価値はありませんので、0ここでもまったく共変量を持つ、そこには観測が存在しない場合がある。 この議論はかなり明確です。

パラメーター間の関心のこの便利な分離のため、よりバランスのとれたサンプルでトレーニングし、切片のみを調整することにより、カテゴリーの不均衡を修正できます。徹底的な議論については、King and Zengをご覧ください。


「この議論」へのリンクは消滅したようです。このリンクを回復する機会はありますか?
アレクセイ・グリゴレフ

1
@ alexey-grigorev UCLAリンクを更新しました
共役

そして、下票を獲得しました。非常に奇妙な。
共役
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.