ロジスティック回帰の背後にある直感
最近、機械学習の勉強を始めましたが、ロジスティック回帰の背後にある直感を理解することができませんでした。 以下は、私が理解しているロジスティック回帰についての事実です。 仮説の基礎として、シグモイド関数を使用します。なぜそれが正しい選択なのか理解していますが、なぜそれが私が理解できない唯一の選択なのかを理解しています。仮説は、適切な出力である確率を表す111、それゆえ私たちの関数のドメインがあるべき[ 0 、1 ][0、1][0,1]、これはシグモイド関数の唯一の財産である私が有用であることが判明し、ここで適切な、しかし、多くの機能は、この特性を満たします。さらに、シグモイド関数には、この形式の導関数f(x)(1−f(x))f(x)(1−f(x))f(x)(1-f(x))、しかし、ロジスティック回帰ではこの特別な形式のユーティリティは見当たりません。 質問:どのようなシグモイド関数についてとても特別な、なぜ私たちは、ドメインと他の機能を使用することはできません?[0,1][0,1][0,1] コスト関数は、2つのパラメータで構成さであれば、Y = 1 、C O S T(時間θ(X )、Y )= - ログ(1 - 時間θ(X ))であれば、Y =をCost(hθ(x),y)=−log(hθ(x))Cost(hθ(x),y)=−log(hθ(x)){\rm Cost}(h_{\theta}(x),y)=-\log(h_{\theta}(x))y=1,Cost(hθ(x),y)=−log(1−hθ(x))y=1,Cost(hθ(x),y)=−log(1−hθ(x))y=1, {\rm Cost}(h_{\theta}(x),y)=-\log(1-h_{\theta}(x))。上記と同じように、なぜそれが正しいのか理解していますが、なぜそれが唯一の形式なのですか?例えば、なぜできませんでした | 時間θ (X ) - Y | コスト関数の良い選択ですか?y=0y=0y=0|hθ(x)−y||hθ(x)−y||h_{\theta(x)}-y| 質問:上記の形式の費用関数について何が特別なのか。なぜ別のフォームを使用できないのですか? ロジスティック回帰の理解を共有していただければ幸いです。