次の重要な境界を検討するかどうかはわかりませんが、ここに行きます。
まず、明確にするために、 -DNFを -term DNF(私はよく行う)と混同しないようにします。変数 -DNF式は、形式です。 where and、。K C X 1、... 、X nは∨ kはiは= 1(ℓをI 、1 ∧ ℓ I 、2。。。ℓ I 、C)∀ 1 ≤ iは≤ kは1 ≤ J ≤ C ℓ I 、J ∈ { X 1、... 、xはnは、ˉ X 1ckcx1,…,xn∨ki=1(ℓi,1∧ℓi,2...ℓi,c)∀1≤i≤k1≤j≤cℓi,j∈{x1,…,xn,x¯1,…,x¯n}
最初に、 -DNFにいくつの異なる用語が存在できるかを尋ねます。各項には、変数のうち、それぞれが否定されているかどうかにかかわらず、異なる可能性のある項になります。2-DNFインスタンスでは、なるように、各項が表示されるか、表示されません可能な「ターゲット」。ここで、は仮説空間です。c n 2 c ( nccn | H| =22c( n2c(nc) H|H|=22c(nc)H
サンプルを取り、次にすべての試すアルゴリズムを想像してみてくださいサンプルで完全に予測できるものが見つかるまで仮説を立てます。 OccamのRazorの定理は、このアルゴリズムでaを見つけるには、約サンプルを取るだけでよいとしています確率エラー持つターゲット。| H | m = O (1m|H|≤ε≥1-δm=O(1ϵ|(H|+1δ)≤ϵ≥1−δ
我々の場合には、用、、つまり(適切な)学習を行うには約サンプルが必要になります。c=2n 2lg|H|=O(n2)n2
しかし、学習におけるゲーム全体は実際にはサンプルの複雑さではありません(ただし、これはゲームの一部であり、特に属性効率の良い学習の場合です)ではなく、多項式時間アルゴリズムを設計しようとしています。効率を気にしない場合は、がPACサンプルの複雑さの最も簡単な答えです。n2
更新(質問が変更された場合):
サンプルの複雑さのみを気にすることを明確に述べたので、私はブルートフォースOccamアルゴリズムを提示しました。これはおそらく最も単純な議論です。しかし、私の答えは少し恥ずかしがり屋でした。 -DNFは実際には多項式時間で学習可能です!これは、Valiantの最初の論文「A Theory of the Learnable」の結果です。実際、 -DNFはどのでも学習可能です。c c = O (1 )2cc=O(1)
議論は次のようになります。 -DNFを
"メタ変数"の分離として表示し、例と矛盾するメタ変数を排除することで分離を学習することができます。このようなソリューションは、「適切な」ソリューションに簡単に変換でき、時間かかります。余談ですが、多項式時間アルゴリズムがあるかどうかはまだ明らかにされていません。≈ n個c O (N C)C = ω (1 )≈ncO(nc)c=ω(1)
サンプルの複雑さも下限であるかどうかについては、答えはほぼイエスです。 Ehrenfeucht et al。によるこの論文。Occamの限界がほぼタイトであることを示しています。n2