線形非分離データは、ロジスティック回帰の多項式機能を使用して学習できますか?


8

私は知っているPolynomial Logistic Regression簡単に、以下の画像のような典型的なデータを学ぶことができます: 私は、次の2つのデータも使用して学習することができるかどうかを疑問に思いましたか。
最初の画像
Polynomial Logistic Regression


ここに画像の説明を入力してください
ここに画像の説明を入力してください

私はもっ​​と説明を追加する必要があると思います。最初の形状を想定します。この2次元入力(x1 ^ 2 ...など)に追加の多項式特徴を追加すると、データを分離できる決定境界を作成できます。X1 ^ 2 + X2 ^ 2 = bを選択するとします。これにより、データを分離できます。追加の機能を追加すると、波状の形状(波状の円や波状の省略記号など)が表示されますが、2番目のグラフのデータを分離することはできませんか?


1
多分それはスリップですが、あなたは暗黙的に回帰ではなく分類について尋ねています...
Emre

1
@Emre実際に多項式ロジスティック回帰について質問しています。あなたは正しいです:)
Media

1
それについてどこで読みましたか?多項ロジスティック回帰という意味ですか?
Emre、

1
私は知らないが、私は多項式ロジスティック回帰聞いたことがないの統計。非線形クラス境界に関心がある場合は、カーネルロジスティック回帰を調べる必要があると思います。
Emre、

1
そこでは多項式ロジスティック回帰への言及はありません。または他の種類のロジスティック回帰。
Emre

回答:


7

はい、理論的には、ロジスティック回帰の多項式拡張は任意の分類境界を近似できます。これは、多項式が任意の関数(少なくとも分類問題に役立つタイプの関数)を近似できるためであり、これはStone-Weierstrassの定理によって証明されています。

この近似がすべての境界形状に対して実用的であるかどうかは、別の問題です。特徴空間に複雑な境界形状があると思われる場合は、他の基底関数(フーリエ級数、例の点からの半径距離)や他の手法(SVMなど)を探すほうがよい場合があります。高次多項式の使用に関する問題は、使用する必要がある多項式の特徴の数が、多項式の次数と元の特徴の数とともに指数関数的に増加することです。

510xy11(x,y)

(1,1):5(1,1):5(1,1):5(1,1):5

それをロジスティック関数に渡すと、0と1に十分近い値が得られます。

2つの円形領域に似ているのは、単純な8の字型の曲線です。

a(x2y2bx4+c)

a,bcya,bca=1,b=0.05,c=1x=3x=3

2つの別々のクラス

x2y20.05x41>011+ez>0.5z>0

1,x2,y2,x4y

実際、ディープニューラルネットワークで解くことができるあらゆる問題-あらゆる深さ-線形回帰(回帰問題の場合)またはロジスティック回帰(分類問題の場合)を使用してフラット構造で解決できます。これは、正しい機能拡張を見つけることの「単なる」問題です。違いは、多項式またはその他のスキームを使用した特徴エンジニアリングは大変な作業であり、開始方法が必ずしも明白ではない一方で、ニューラルネットワークは機能する特徴拡張を直接検出しようとすることです。たとえば、どのような畳み込みニューラルに対して多項式近似を作成するかを検討してください。ネットワークは画像のためですか?それは不可能のようです。それも非常に非現実的である可能性があります。しかし、それは存在します。


最初の段落について本当によろしいですか?非凸形状は本当に多項式を使用して学習できますか?
メディア

1
@NeilSlater私は上記の円を解決しました。XORも簡単です。「xy」の用語を追加するだけです。
Emre、2017

1
@Emre:ありがとう。しかし、|x|それは別の非直線性であるため、純粋であることは許可されていません。
Neil Slater

1
なぜ多項式で停止するのですか?入力の導関数をとるわけではないので、必要な関数を使用します。
Emre 2017

1
@Emreはい、他の機能が役立つ可能性があることを質問ですでに提案しています。しかし、「多項式ロジスティック回帰」という用語を使用したOPのポイントは、多項式のみを使用することを意図しているということです。そうでなければ線形オプティマイザで使用するための機能の自動多項式展開を行うライブラリがいくつかあると思います。
Neil Slater
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.