PAC学習軸平行長方形


7

軸平行長方形が実現可能な場合にPAC学習可能であるという証明を理解しようとしています。これは、十分なデータがあるが与えられると、ような関数見つけることができることを示します。 ここでのエラーは、選択した関数エラーが発生する確率。ϵ,δh

P[エラー>ε]δ
h

さて、軸平行長方形(バイナリ分類)の場合、通常の引数は次のようになります真の長方形とし、を正の例を含む最小の長方形とします。明らかにとします。4つの長方形ストリップを考慮します。と間。明らかに、それらすべてに確率場合、エラーが発生する確率はより小さいため、少なくとも1つがエラー発生する確率があると想定できます。RRRRRRε/4εε/4

そのようなストリップの場合、すべてのトレーニング例を正しく分類する確率はせいぜい。したがって、すべてのストリップに結合された和集合をとると、すべてを正しく分類する確率は、そして少しの代数を使用すると、サンプルの複雑度は。メートル1ε/4メートル41ε/4メートル4eメートル/4メートル4/εln4/δ

これは、もう少し詳しく説明しているPDFです。いくつかの写真を使用して、ここに収めるために、できる限り議論を凝縮する必要がありました。

私の質問は、なぜ4つの長方形のストリップを別々に考慮する必要があるのか​​、と間の領域の確率はより大きくなければならない(そうでない場合は完了しているため)と言えないのです。したがって、同じ引数を使用して、より適切な境界到達しますか?RRεメートル1/εln1/δ

長い質問でごめんなさい。事前に感謝します。


数学ははるかに簡単です。長方形で機能するように証明をどのように変更しますか?
randomsurfer_123 2015

@ randomsurfer_123それがそうです。私が投稿で言及しているpdfの証明が軸平行長方形であることをどのように利用しているかはわかりません。小さい長方形と大きい長方形の間の領域にある点の確率について議論しているだけです。何かが欠けているに違いありません。それ以外の場合、これは他の形状に適用できるためです。
alejopelaez 2015

回答:


1

質問は少し曖昧ですが、あなたが主張したいことはこの線に沿っているようです:を学習する概念とし、任意のをの-fraction。次に、ある確率でにが含まれます。RRR1εRRR

これの問題は、特定の確率が特定の選択に依存することです。あなたが混乱しているのは、目に見えない例でがうまく機能することです。構築により、はすべてのトレーニングデータを正しく分類します。悪いイベントは、実際にはすべてのトレーニングデータが小さすぎる長方形に集中していることです。これは、ほとんどの場合、すべてのトレーニング例でストリップの1つが見落とされる可能性があります。RRR


0

うーん...まあ、あなたが言及する証明では、いくつかの分布Dから点(x、y)を引き、それらが本当に正方形に収まるかどうかを確認します。つまり、各境界に対して同じを選択します(最大x、最小x、最大y、最小y)。円があったら、それを行うことはできません。半径のデルタを選択する必要があります。半径は座標の関数です。そのため、証明はより複雑になります。δ

凹面でないポリゴンを使用する場合は、さらに難しくなります。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.