マルチクラスパーセプトロンはどのように機能しますか?


13

数学の背景はありませんが、単純なパーセプトロンの仕組みを理解しており、超平面の概念を理解していると思います(幾何学的には、線が分離するように2つの点群を分離する3D空間の平面として想像します) 2D空間の2つの点群)。

しかし、1つの平面または1つの線が3D空間または2D空間の3つの異なる点群をどのように分離するかはわかりません。これは幾何学的に不可能です。

ウィキペディアの記事の対応するセクションを理解しようとしましたが、「ここでは、入力xと出力yは任意のセットから描画されます」という文で惨めに失敗しました。誰かが私にマルチクラスパーセプトロンを説明し、それが超平面のアイデアとどのように関係するのか、あるいはあまり数学的ではない説明を私に指し示すことができますか?

回答:


8

我々はデータがあるとここで、X IR nは入力ベクトルであるとY I{ 赤、青、緑}バツ1y1バツkykバツRny{赤、青、緑}分類です。

バイナリの結果の分類子を作成する方法を知っているので、これを3回行います。結果を{ blue、red or green }{ green、blue or red }にグループ化します{赤、青、緑}{青、赤または緑}{緑、青、赤}ます。

各モデルは、関数の形式を取り、それぞれf Rf Bf Gと呼びます。これは、各モデルに関連付けられた超平面から符号付き距離への入力ベクトルを取ります。ここで、正の距離は、f Bの場合は青、f Rの場合は赤、f Gの場合は緑の予測に対応します。基本的に、f Gx が正であるほど、モデルはxfRnRfRfBfGfBfRfGfGバツバツ緑色、およびその逆です。出力が確率である必要はなく、モデルがどれだけ自信があるかを測定できればよいだけです。

入力された所定の、我々は、に応じて分類ARGMAX C F CX そうであれば、fはGX の中で最大である{ F GX F BX F RX }我々は希望xの緑を予測します。バツargmaxc fcバツfGバツ{fGバツfBバツfRバツ}バツ

この戦略は「1対すべて」と呼ばれ、ここでそれについて読むことができます


3

私はそのWiki記事をまったく理解できません。これを説明するための別のスタブがあります。

1つのロジスティック出力ノードを持つパーセプトロンは、2つのクラスの分類ネットワークです。出力します。これは、一方のクラスに存在する確率、もう一方のクラスに存在する確率、単純に1 - pp1p

2つの出力ノードを持つパーセプトロンは、3つのクラスの分類ネットワークです。二つのノード、各出力クラスである確率、および第三のクラスである確率は、1 - Σはiは= 1 2 P Ip1=12p

等々; 出力ノードを持つパーセプトロンは、m + 1クラスの分類器です。実際、隠れ層がない場合、単純なパーセプトロンがロジスティック回帰と同じであるように、そのようなパーセプトロンは基本的に多項ロジスティック回帰モデルと同じです。mm+1


出力は実際の確率であると確信していますか?とにかく、私は多項ロジスティック回帰がどのように機能するのかわからないので、それを調べなければなりません。しかし、2つ以上の出力ノードを持つパーセプトロンがどのように構築されるかを説明する(アルゴリズムの)方法はありませんか?彼らは何とか一緒に連鎖していますか?
wnstnsmth
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.