まず簡単な回答をしてから、より長いコメントを:
回答
SNE手法は、元のデータ空間と低次元の埋め込み空間の両方で、類似度がオブジェクトのペアの確率分布を形成するように、N×Nの類似度行列を計算します。具体的には、確率は一般に、入力データまたは埋め込みから計算された正規化されたガウスカーネルによって与えられます。分類に関しては、これはすぐにインスタンスベースの学習方法を思い起こさせます。それらの1つをリストしました:RVMを備えたSVM、@ amoebaはkNNをリストしています。放射基底関数ネットワークもありますが、私は専門家ではありません。
コメント
そうは言っても、t-SNEプロットだけを見てデータセットを推論する場合は、二重に注意します。t-SNEは必ずしもローカル構造に焦点を当てているわけではありません。ただし、perplexity
パラメーターを調整することで調整できます。パラメーターは、データのローカルアスペクトとグローバルアスペクトの間で注意のバランスをとる方法を(大まかに)調整します。
このコンテキストでは、perplexity
それ自体が、各観測値が持つ可能性のある近接する近傍の数に関する暗示的な試みであり、ユーザーが指定します。原稿用紙の状態:「T-SNEの性能は、パープレキシティの変化に対してかなりロバストであり、典型的な値は5と50の間です」ただし、私の経験では、t-SNEを最大限に活用するには、さまざまな難易度の複数のプロットを分析する必要がある場合があります。
つまり、調整learning rate
とperplexity
は、同じ数のトレーニングステップで同じデータを使用して、非常に異なる外観の2次元プロットを取得することが可能です。
この蒸留紙t-SNEの効果的な使用方法は、t-SNE分析の一般的な落とし穴の優れた要約を提供します。要点は次のとおりです。
これらのハイパーパラメーター(学習率、困惑度など)は本当に重要です
t-SNEプロットのクラスターサイズは何も意味しません
クラスタ間の距離は何も意味しないかもしれません
ランダムノイズは常にランダムに見えるとは限りません。
いくつかの形を見ることができます
トポロジーでは、複数のプロットが必要になる場合があります
具体的には、上記のポイント2、3、および6から、個々のt-SNEプロットを見て、データの分離可能性について推論することを2度考えます。適切なパラメーターを使用して明確なクラスターを示すプロットを「製造」できる多くの場合があります。