類似度行列を(ユークリッド)距離行列に変換する


27

ランダムフォレストアルゴリズムでは、Breiman(著者)は次のように類似度行列を作成します。

  1. すべての学習例をフォレスト内の各ツリーに送信します

  2. 2つの例が同じ葉にある場合、類似度マトリックスの対応する要素を1ずつ増やします。

  3. 木の数で行列を正規化する

彼は言い​​ます:

ケースnとkの間の近接性は、行列{prox(n、k)}を形成します。それらの定義から、この行列が対称で正定であり、1に等しい対角要素で上に1で区切られていることを示すのは簡単です。値1-prox(n、k)はユークリッドの平方距離ケースの数以下の次元の空間。ソース

彼の実装では、彼はsqrt(1-prox)を使用します。ここで、proxは類似度行列で、距離行列に変換します。これは、上記の「ユークリッド空間での二乗距離」と関係があると思います。

1プロキシがユークリッド空間の平方距離である理由と、平方根を使用して距離行列を取得する理由を誰かが少し明らかにすることはできますか?

回答:


30

ここに画像の説明を入力してください

d122=h12+h222h1h2cosϕh12h22h1h2cosϕ (=内積、=内積)ベクトル1と2の。

スカラー積はまた、1と2との間の角型の類似性と呼ばれ、ユークリッド空間では、幾何学的に最も有効である類似それは容易に(参照その逆ユークリッド距離とバイスに変換されるため、メジャーここ)。

h2cosϕrσ1σ2r12サブジェクト空間「表現の方法。コサイン定理は、このインスタンスで「ベクトル」と見なされるもの(データポイントまたはデータフィーチャ)に関係なく真のままです。]

hsd2=2(1s)d2d2=1srr

sshd

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.