インスタンスのセットが与えられます。インスタンスごとに、(数値)特徴(、、...、)、n >> mで構成される特徴ベクトルがあります。さらに、インスタンスごとに数値スコア(観測可能)があります。私はしたいと思います:
- 特徴のどのサブセットまたはその線形結合がスコアを最もよく説明しているかを調べます。
- このための素晴らしい視覚化を作成します。
主成分分析(PCA)を指摘されました。PCAの問題は、特徴ベクトルのみが考慮されることです。PCAは、特徴を数値スコア関連付けません。
実用的なアプリケーション:多数の問題インスタンス(巡回セールスマンの問題など)と、問題を解決するためのいくつかのアルゴリズムがある場合。インスタンスを解決するたびに、インスタンスの解決にかかった合計時間(=スコア)を測定できます。さらに、インスタンスごとに、インスタンスのサイズ、グラフの直径など、いくつかの機能を取得できます。これらの機能のどれが計算時間を最もよく説明しますか?