私はAndrew Ng Stanfordの講義から機械学習を勉強していて、VC次元の理論に出くわしました。講義と私が理解したことによると、VCディメンションの定義は、
分類器によって粉砕できるようにポイントのセットを見つけることができ(つまり、すべての可能な2 nラベリングを正しく分類する)、粉砕できるn + 1ポイントのセットを見つけることができない場合(つまり、任意のセットの場合)n + 1ポイントには、分類子がすべてのポイントを正しく分離できないように、少なくとも1つのラベル付け順序があります)。VCディメンションはnです。
また、教授は例を取り、これをうまく説明しました。それは:
みましょう、
次に、次の図に示すように、分離した超平面を使用して、3つの点を正しく分類できます。
そして、それがのVC次元が3である理由です。2D平面の任意の4つのポイントに対して、線形分類器はポイントのすべての組み合わせを粉砕することができないためです。例えば、
このポイントのセットでは、このセットを分類するために描画できる分離超平面はありません。したがって、VCディメンションは3です。
私はここまでアイデアを得ました。しかし、次のタイプのパターンに従っている場合はどうでしょうか?
または、3つの点が互いに一致するパターン。ここでも、3つの点の間の分離超平面を描画できません。ただし、このパターンはVCディメンションの定義では考慮されていません。どうして?同じ点は私がここで見ている講義、ここ16:24でも議論されていますが、教授はこれの正確な理由について言及していません。
説明の直感的な例は高く評価されます。ありがとう