2つのデータセットのプロパティは、線形分離可能性のプロパティであり 、単純に、それらを分離する線があります。多くの機械学習は、関心のある分離を実行する線である線形分類器を見つけることに専念しています。
あなたが線について話しているとき、私はあなたのポイントが平面にあると仮定します。何がやりたいことは価値見つけることです、と、その結果、すべてのポイントについてセットで、とすべての点についてで、。したがって、不等式は、セット分類器とことができます。w1w2w3(a1,a2)Aw1a1+w2a2≥w3(b1,b2)Bw1b1+w2b2<w3w1x+w2y≥w3A
最適なライン(線形回帰、ロジスティック回帰など)を決定するための機械学習アルゴリズムが多数あります。これらは、何らかのエラーメトリックに基づいて値を見つけます。次に、すべてのポイントが正しく分類されているかどうかをテストできます。つまり、すべての値が上記の式を満たし、についても同様に満たすかどうかです。w1,w2,w3AB
そのような行が存在するかどうかだけに関心があるので、既存の手法を使用する必要があります(おそらくそれはもっと簡単でしょう)。自由変数に関して次の等式のコレクションを設定するだけ。w1,w2,w3
w1ai1+w2ai2≥w3各ここで、。i=1,..,|A|A={(a11,a12),…,(a|A|1,a|A|2)}
、J = 1 、。。、| B | B = { (b 1 1、b 1 2)、… 、(b | B | 1、b | B | 2)}w1bj1+w2bj2<w3各ここで、。j=1,..,|B|B={(b11,b12),…,(b|B|1,b|B|2)}
これらの制約に一貫性がある場合、線が存在します。