私が取り組んでいる特定の問題(競合)には、次の設定があります:21の機能([0,1]の数値)とバイナリ出力。約100 Kの行があります。設定は非常に騒々しいようです。
私と他の参加者はしばらくの間機能生成を適用し、この設定ではt分布の確率的近傍埋め込みがかなり強力であることが判明しました。
私はこの記事「t-SNEを効果的に使用する方法」に出くわしましたが、それでも分類の設定で最適なハイパーパラメーターを選択する方法について結論を出すことはできません。
経験則(特徴の数、埋め込みの次元->困惑の選択)はありますか?
さまざまな設定を繰り返すのに時間がかかりすぎるため、現時点ではアドホック設定を適用します。コメントありがとうございます。