ニューラルネットワークを非線形分類モデルにするものは何ですか?


18

私は非線形分類モデルの数学的な意味を理解しようとしています:

ニューラルネットが非線形分類モデルであるという記事を読んだばかりです。

しかし、私はちょうどそれを理解しています:

ここに画像の説明を入力してください

最初の層:

h1=x1wx1h1+x2wx1h2

h2=x1wx2h1+x2wx2h2

次の層

y=bwby+h1wh1y+h2wh2y

に簡略化できます

=b+(x1wx1h1+x2wx1h2)wh1y+(x1wx2h1+x2wx2h2)wh2y

=b+x1(wh1ywx1h1+wx2h1wh2y)+x2(wh1ywx1h1+wx2h2wh2y)

2層ニューラルネットワークは単純な線形回帰です

=b+x1W1+x2W2

これは、任意の数の重みの線形結合が再び線形であるため、任意の数のレイヤーに表示できます。

ニューラルネットを実際に非線形分類モデルにするものは何ですか?
アクティベーション関数は、モデルの非線形性にどのように影響しますか?
説明して頂けますか?

回答:


18

ニューラルネットワークのノードの活性化関数は忘れてしまいます。これは非線形であり、モデル全体を非線形にします。

あなたの式では完全に正しいわけではありません、どこで、

h1w1x1+w2x2

だが

h1=sigmoid(w1x1+w2x2)

シグモイド関数は次のようになります。sigmoid(x)=11+ex

ここに画像の説明を入力してください

数値例を使用してシグモイド関数の影響を説明します、次にます。一方、、あり、非線形であるとほぼ同じであると仮定します。シグモイド4 = 0.99 w 1 x 1 + w 2 x 2 = 4000 シグモイド4000 = 1 シグモイド4 w1x1+w2x2=4sigmoid(4)=0.99w1x1+w2x2=4000sigmoid(4000)=1sigmoid(4)


さらに、このチュートリアルのスライド14は、どこが間違っていたかを正確に示していると思います。してくださいませんotuputは-7.65ではありませんが、シグモイド7.65 H1sigmoid(7.65)

ここに画像の説明を入力してください


1
アクティベーション関数は、モデルの非線形性にどのように影響しますか?説明して頂けますか?
アルバロジョアン

3

複数の線形レイヤーが単一の線形レイヤーと同等になる可能性があることは正しいです。他の答えが言ったように、非線形活性化関数は非線形分類を可能にします。分類器が非線形であると言うことは、分類器が非線形の決定境界を持つことを意味します。決定境界は、クラスを分離する表面です。分類器は、決定境界の片側のすべてのポイントに対して1つのクラスを予測し、反対側のすべてのポイントに対して別のクラスを予測します。

一般的な状況を考えてみましょう:非線形の隠れユニットの複数の層とシグモイド活性化関数を持つ出力ユニットを含むネットワークでバイナリ分類を実行します。は出力を、は最後の非表示層のアクティベーションのベクトル、は出力ユニットへの重みのベクトル、h wyhwb

y=σ(hw+b)

ここで、はロジスティックシグモイド関数です。出力は、クラスがある確率として解釈されます。予測クラスは次のとおりです。1 、Cσ1c

c={0y0.51y>0.5

隠されたユニットのアクティベーションに関する分類ルールを考えてみましょう。隠れユニットの活性化が線投影されていることがます。クラスを割り当てるためのルールは関数で、線に沿った投影に単調に関連しています。したがって、分類規則は、線に沿った投影が特定のしきい値よりも小さいか大きいかを判断することと同等です(この場合、しきい値はバイアスの負数によって与えられます)。これは、決定境界が線に直交する超平面であり、そのしきい値に対応する点で線と交差することを意味します。yhW+by

先に言ったように、決定境界は非線形ですが、超平面はまさに線形境界の定義です。しかし、出力の直前に境界を非表示ユニットの関数として考えてきました。隠れユニットの活性化は、以前の隠れ層とその非線形活性化関数のため、元の入力の非線形関数です。ネットワークについて考える1つの方法は、データをいくつかの特徴空間に非線形にマッピングすることです。この空間の座標は、最後の非表示ユニットのアクティブ化によって与えられます。ネットワークは、この空間で線形分類を実行します(この場合、ロジスティック回帰)。元の入力の関数として決定境界を考えることもできます。この関数は、入力から隠れユニットのアクティベーションへの非線形マッピングの結果として、非線形になります。

このブログ投稿は、このプロセスの素晴らしい数字とアニメーションを示しています。


1

非線形性は、シグモイド活性化関数1 /(1 + e ^ x)に由来します。ここで、xは、質問で参照した予測子と重みの線形結合です。

ところで、分母が非常に大きくなって分数がゼロに近づくか、e ^ xが非常に小さくなって分数が1/1に近づくため、このアクティベーションの境界はゼロと1です。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.