マルチクラスのロジスティック回帰


10

によって与えられるマルチクラスのロジスティック回帰のモデルを得ま​​した

P(Y=j|X(i))=exp(θjTX(i))1+m=1kexp(θmTX(i))

ここで、kはクラスの数thetaは推定されるパラメーターjはj番目のクラスXiはトレーニングデータ

分からなかったのは、分母の部分 がモデルを正規化したです。つまり、確率が0と1の間に留まるということです。

1+m=1kexp(θmTX(i))

私はロジスティック回帰に慣れていることを意味します

P(Y=1|X(i))=1/(1+exp(θTX(i)))

実際、私は正規化のことと混同しています。この場合、シグモイド関数であるため、値が0未満または1を超えることはありませんが、マルチクラスの場合は混乱します。なぜそうなのですか?

これは私の参照https://list.scms.waikato.ac.nz/pipermail/wekalist/2005-February/029738.htmlです。正規化するべきだったと思います

P(Y=j|X(i))=exp(θjTX(i))m=1kexp(θmTX(i))

2
ヒント:ロジスティック回帰では、暗黙的に処理する確率が2つあります。確率と確率です。これらの確率の合計はなければなりません。Y=1Y=01
whuber

1
他のいくつかの投稿に基づいて、方程式をマークアップする方法を知っています。ここのテキストの方程式は読みにくく、(添え字?)は混乱します-マークアップできますか?LATEX
マクロ

2
ここでは非常に多くの質問を投稿しているので、一時停止して、よくある質問をする方法に関するFAQを読んでください。マークアップのヘルプを読んで、数式を読みやすくします。TEX
whuber

方程式を編集しました。@ whuber実は、バイナリーではなく、マルチクラスのロジスティック回帰に関連して混乱しています。ドノミネーターにすべての要素を追加すると確率が正規化されるのはどうしてか心配です
user34790

@ user34790、各項を合計で割ると、個々のクラス確率の合計が1になります。ところで、とは何ですか?X(i)
マクロ

回答:


13

数式が間違っています(合計の上限)。クラス()のロジスティック回帰では、基本的にバイナリロジスティック回帰モデルを作成しつのクラスを参照またはピボットとして選択します。通常、最後のクラスが参照として選択されます。したがって、参照クラスの確率は、によって計算できます確率の一般的な形式は番目のクラスは、基準となる従ってそしてKK>2K1K

P(yi=K|xi)=1k=1K1P(yi=k|xi).
P(yi=k|xi)=exp(θiTxi)i=1Kexp(θiTxi).
KθK=(0,,0)T
i=1Kexp(θiTxi)=exp(0)+i=1K1exp(θiTxi)=1+i=1K1exp(θiTxi).
最終的に、すべてのに対して次の式が得られます: k<K
P(yi=k|xi)=exp(θiTxi)1+i=1K1exp(θiTxi)

4
最大の可能性を行う場合、参照クラスの選択は重要ではないことに注意してください。ただし、ペナルティ付きの最尤、またはベイズ推定を行う場合は、確率を過剰にパラメーター化したままにし、過剰なパラメーター化を処理する方法をペナルティに選択させる方が便利な場合があります。これは、ほとんどのペナルティ関数/優先順位が、参照クラスの選択に関して不変ではないためです
確率論的

@sebp、は少し混乱しているようです。観察にはを使用し、カテゴリ反復には他の文字を使用することをお勧めします。iik
garej 2017

4

私はあなたがタイプミスに惑わされていると思う:あなたのあるべき最初の方程式に。ロジスティックの場合に表示される1は、実際には。たとえば、番目のです。 K - 1つのEXP 0 、K θ = 0kk1exp(0)kθ=0

と仮定します。最後の定式化からようなロジスティック回帰バージョンに到達できることに注意してください。 複数のクラスの場合、最初の2つの量の分母を指数線形予測子の合計で置き換えるだけです。 EXP B θ1X=b

exp(b)exp(0)+exp(b)=exp(0)exp(0)+exp(b)=11+exp(b)
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.