ランダムフォレストアルゴリズムでは、Breiman(著者)は次のように類似度行列を作成します。
すべての学習例をフォレスト内の各ツリーに送信します
2つの例が同じ葉にある場合、類似度マトリックスの対応する要素を1ずつ増やします。
- 木の数で行列を正規化する
彼は言います:
ケースnとkの間の近接性は、行列{prox(n、k)}を形成します。それらの定義から、この行列が対称で正定であり、1に等しい対角要素で上に1で区切られていることを示すのは簡単です。値1-prox(n、k)はユークリッドの平方距離ケースの数以下の次元の空間。ソース
彼の実装では、彼はsqrt(1-prox)を使用します。ここで、proxは類似度行列で、距離行列に変換します。これは、上記の「ユークリッド空間での二乗距離」と関係があると思います。
1プロキシがユークリッド空間の平方距離である理由と、平方根を使用して距離行列を取得する理由を誰かが少し明らかにすることはできますか?