私の知る限り、オートエンコーダとt-SNEの両方が非線形次元削減に使用されています。それらの違いは何ですか、なぜ私はどちらを使用する必要があるのですか?
私の知る限り、オートエンコーダとt-SNEの両方が非線形次元削減に使用されています。それらの違いは何ですか、なぜ私はどちらを使用する必要があるのですか?
回答:
どちらも、データのより低い次元の埋め込みを見つけようとします。ただし、さまざまな最小化の問題があります。より具体的には、オートエンコーダーは再構成エラーを最小限に抑えようとしますが、t-SNEはより低い次元の空間を見つけようとすると同時に、近隣の距離を維持しようとします。この属性の結果として、t-SNEは通常、プロットと視覚化に適しています。
[オートエンコーダ]は主に、潜在空間でのデータの分散を最大化することに焦点を当てています。その結果、オートエンコーダは、潜在空間でのデータのローカル構造の保持に、マニホールド学習者よりも成功しません...
「ローカル構造を保持することによるパラメトリック埋め込みの学習」から、Laurens van der Maaten(https://lvdmaaten.github.io/publications/papers/AISTATS_2009.pdf)
[1]で説明されているように、オートエンコーダーとt-SNEを一緒に使用して、高次元データの視覚化を向上させることができます。
特に2D視覚化では、t-SNEがおそらく最良のアルゴリズムですが、通常は比較的低次元のデータが必要です。したがって、高次元データの類似関係を視覚化するための適切な戦略は、オートエンコーダを使用してデータを低次元空間(32次元など)に圧縮し、t-SNEを使用して圧縮データを2D平面にマッピングすることです。 。
[1] https://blog.keras.io/building-autoencoders-in-keras.html