LLE(ローカル線形埋め込み)アルゴリズムの手順を説明してください。


12

LLEのアルゴリズムの背後にある基本原則は3つのステップで構成されていることを理解しています。

  1. k-nnなどのメトリックによって各データポイントの近傍を見つける。
  2. 近傍がデータポイントに与える影響を示す各近傍の重みを見つけます。
  3. 計算された重みに基づいて、データの低次元埋め込みを構築します。

しかし、ステップ2とステップ3の数学的説明は、私が読んだすべての教科書とオンラインリソースで混乱しています。数式が使用される理由を説明することはできません。

これらの手順は実際にはどのように実行されますか?使用されている数式を直感的に説明する方法はありますか?

参照:http : //www.cs.nyu.edu/~roweis/lle/publications.html

回答:


9

ローカル線形埋め込み(LLE)を使用すると、離れたオブジェクト間の距離を推定する必要がなくなり、ローカル線形適合によりグローバルな非線形構造が復元されます。LLEは、学習率や収束基準などのパラメーターを必要としないため、有利です。また、LLEは、Yます。LLEの目的関数は

ζ(Y)=(YWY)2=Y(IW)(IW)Y
重み行列Wの要素wijオブジェクトのiおよびjあればゼロに設定されjの最近傍ないi、そうでなければ、K-の重みをオブジェクトの最近傍i最小二乗法を介して決定さはフィット
U=Gβ
従属変数ここでUあるK×1のもののベクトルは、Gは、オブジェクト iのすべての最近傍のK×Kグラム行列であり、 βは、和と統一の制約に従う重みの K × 1ベクトルです。ましょう Dが対称半正定値である K × K個のK最近傍のすべてのペアの距離行列 P次元オブジェクト xは Iを。それことを示すことができる Gは二重中心距離行列に等しい τ要素と τ LのM = - 1iβK×1DK×KpxiGτ
τlm=12(dlm21Kldlm21Kmdlm2+lmdlm2).
K回帰係数を用いて数値的に決定される
βK×1=(ττ)K×K1τUK×1,
およびそれらが統一に合計を確認するためにチェックされています。β値はWのiに埋め込まれWオブジェクトi K最近傍と転置要素に対応するさまざまな列位置。これは、データセット内のi番目のオブジェクトごとに繰り返されます。最近傍K数が少なすぎると、Wがまばらになり、固有解析が困難になる可能性があることに注意する必要があります。これは、ことが観察されたK=9の最近傍をもたらしたW固有解析中に病理が含まれていませんでし行列。目的関数は、IW IWの最小の非ゼロ固有値を見つけることにより最小化され ます
(IW)(IW)E=ΛDE.
X の簡約形式はY=Eで表されます。ここで、E Λの 2つの最低固有値に基づいてn×2次元を持ちます。 Λ


YYW

はい。ただし、たとえば8次元がある場合、ランダムなデータの場合、文字通り、すべてのポイントは、他の9つの線形結合として、無限の方法で完全に書き込むことができます。
スコット

テクニックを実装するときは常に「what if」シナリオがあり、それがパラメーター制約が使用される理由です。
JoleT
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.