決定木を最適化するためのアルゴリズム

バックグラウンド

二分決定木 $T$ は、ルートからリーフへのパスがインデックスを繰り返さないように、各内部ノード（およびルート）がインデックスラベル付けされているルート付きツリー出力によってラベル付けされ、各エッジは左の子に対して、右の子に対してでラベル付けされ。入力ツリーを適用するには： $j \in \{1,..., n\}$ $\{A,B\}$ $0$ $1$ $x$

ルートから開始
リーフにいる場合は、リーフラベルまたはを出力して終了します $A$ $B$
ラベル読む $j$ あなたの現在のノードのを、もし $x_j = 0$ その後、左の子に移動している場合 $x_j = 1$ 、次に右の子に移動します。
ステップ（2）にジャンプします

ツリーは、特に、我々は木言う、機能を評価するための方法として使用されている $T$ 合計関数を表し $f$ それぞれについて場合 $x \in \{0,1\}^n$ 我々は $T(x) = f(x)$ 。ツリーのクエリの複雑さはその深さであり、関数のクエリの複雑さはそれを表す最小のツリーの深さです。

問題

バイナリ決定木Tが与えられると、TとT 'が同じ関数を表すような最小の深さのバイナリ決定木T'が出力されます。

質問

このための最も有名なアルゴリズムは何ですか？下限はわかっていますか？ことがわかったらどうしますか？がほぼ最小の深さであることが必要な場合はどうでしょうか？ $\text{depth}(T') = O(\log \text{depth}(T))$ $T'$

素朴なアプローチ

ナイーブアプローチには、が与えられ、深さすべてのバイナリ決定木を再帰的に列挙し、それらがと同じものに評価されるかどうかをテストします。これには $d = \text{depth}(T)$ $d - 1$ $T$ ステップ（任意のに対して評価するものをチェックするのにステップかかると仮定します）。より良いアプローチはありますか？ $O(\frac{d 2^n n!}{(n - d)!})$ $d$ $T(x)$ $x$

動機

この質問は質問複雑さと時間複雑さの間のトレードオフの前の質問によって動機づけられます。特に、目標は全機能の時間分離を制限することです。実行時間時間最適アルゴリズムからツリーを作成し、クエリ最適アルゴリズムためにツリーに変換したいと思います。残念ながら、もし（そして多くの場合、 $T$ $t$ $T'$ $t \in O(n!/(n - d)!)$ $d \in \Theta(n)$ ）ボトルネックは変換です。を置き換えることができたらいいですねようなものによって。 $n!/(n - d)!$ $2^d$

ds.algorithms query-complexity decision-trees

— アルテム・カズナチェフ
ソース

最適な決定木を見つけることはNP完全です。決定理論とデータマイニングのクラスでは、それらはメモに基づいていたと教えられ、結果を紹介した元の論文を知りません。

— chazisop

@chazisopクール、ありがとう。最適な意思決定ツリーを見つけることがNPにあることは私には明らかではありませんが、それについてさらに検討します。定理文を知ることは、それを証明するための途中にあることもあります：D。

— アルテムKaznatcheev

これに関する最初の参照は、学習決定リストとツリーの下限です。（ハンコックら

— レフレイジン

最適な決定木を見つけることがNP完全問題であることの証明は、Laurent HyafilとRonald L.によって与えられました。最適な二分決定木の構築におけるRivest はNP完全です（1976）。参照：ここ

— アントワーヌ

答えは3つありますが、いずれも硬度の結果が多少異なります。

ましょう、いくつかの関数です。 $f: \{0,1\}^n \rightarrow \{0,1\}$

回答1

と数を計算する決定木与えられた場合、最大でその数のサイズのを計算する決定木が存在するかどうかを判断するのはNP困難です。 $T$ $f$ $T'$ $f$ （ザンテマとボドレンダー'00）

回答2

計算する決定木与えられた場合、を計算する最小の決定木を任意の定数因子に近似することはNP困難です。 $T$ $f$ $f$ （シリング'08）

回答3

してみましょう最小の決定木コンピューティングのサイズで。決定木所与算出仮定すると、一部の、一方が等価決定木を見つけることができない大きさのいずれかのため。 $s$ $f$ $T$ $f$ $NP \subsetneq DTIME(2^{n^\epsilon})$ $\epsilon < 1$ $T'$ $s^k$ $k \ge 0$

このより強い答え（より弱い仮定に基づく）は、次の引数を介して、決定木のOccamアルゴリズムの学習理論における既知の結果から作成できると思います。

それは上の決定木を見つけることが可能であるの時間内で変数を、どこ分布（PACモデル）からの例と一致し、最小の決定木です。（ブルーム'92） $n$ $n^{\log s}$ $s$
仮定一部の、我々はPACサイズ学ぶことができないサイズによって決定木をいずれかのために決定木。（Alekhnovich et al。'07） $NP \subsetneq DTIME(2^{n^\epsilon})$ $\epsilon < 1$ $s$ $s^k$ $k \ge 0$

これらの2つの結果は、問題の難易度の結果を暗示しているようです。一方（1）では、大きな決定木を見つけることができます。一方（2）では、サイズが存在する場合でも、サイズ同等の「小さい」サイズを取得するために最小化することはできません。 $s^k$ $s$

— レフ・レイジン
ソース

（私はこの回答からあなたの答えを見つけました、それは1時間未満前に投稿されました。）

$\:$ それは「のように見える

」ポジティブ」に置き換えることができ

が減少するので、

封じ込めの右手側が作る小さいです。

ϵ < 1

$\epsilon < 1$

ϵ

$\epsilon$

ϵ

$\epsilon$

$\:$ また、その論文のどこに2.示されていますか？

$\;\;\;\;$

ここでは抽象で箇条書きの＃2を参照してください：researcher.watson.ibm.com/researcher/files/us-vitaly/...

— レフReyzin

（リッキーデマーと同じ回答から）ポイント1と2から「回答3」を取得する方法をもう少し詳しく教えてください。私は...学習理論に精通していないですし、部品を接続する苦労を持っている

— マルク・

この一貫性の問題と学習可能性は、Occamのカミソリを介して密接に関連しています。アイデアは、小さなセットから一貫した機能を見つけることができれば、PAC学習に成功できるということです。したがって、学習結果の難易度は「一貫性の難易度」の結果を意味します。私は...コメントで説明することができますどのくらいのより多くのわからない

— レフReyzin

私が理解している限り、1に対して引き起こされたアルゴリズムは、2と矛盾するために必要な

時間内に実行されません（正しく取得した場合の記事の正確な結果）決定木のポリタイム学習アルゴリズムはないという）。ですから、あなたの議論に問題があるかもしれません。

P o l y (n, s)

$Poly(n,s)$

— マーク