軸平行長方形が実現可能な場合にPAC学習可能であるという証明を理解しようとしています。これは、十分なデータがあるが与えられると、ような関数見つけることができることを示します。 ここでのエラーは、選択した関数エラーが発生する確率。
さて、軸平行長方形(バイナリ分類)の場合、通常の引数は次のようになります真の長方形とし、を正の例を含む最小の長方形とします。明らかにとします。4つの長方形ストリップを考慮します。と間。明らかに、それらすべてに確率場合、エラーが発生する確率はより小さいため、少なくとも1つがエラー発生する確率があると想定できます。
そのようなストリップの場合、すべてのトレーニング例を正しく分類する確率はせいぜい。したがって、すべてのストリップに結合された和集合をとると、すべてを正しく分類する確率は、そして少しの代数を使用すると、サンプルの複雑度は。
これは、もう少し詳しく説明しているPDFです。いくつかの写真を使用して、ここに収めるために、できる限り議論を凝縮する必要がありました。
私の質問は、なぜ4つの長方形のストリップを別々に考慮する必要があるのか、と間の領域の確率はより大きくなければならない(そうでない場合は完了しているため)と言えないのです。したがって、同じ引数を使用して、より適切な境界到達しますか?
長い質問でごめんなさい。事前に感謝します。