回答:
PCAアルゴリズムを実行した後、主成分を取得し、それらが保持する情報量でソートします。セット全体を保持する場合、情報は失われません。それらを1つずつ削除して元のスペースに投影し直すと、情報損失を計算できます。削除された主成分の数に対してこの情報損失をプロットし、それが意味のある「肘」を作るかどうかを確認できます。ただし、これの多くはユースケースに依存します。
私は通常、K値が保持する情報の割合をチェックします。8つのフィールドのうち、2つが情報の90%を保持しているとします。その場合、他の6つまたは5つのフィールドを含めることには意味がありません。768の入力のうち、mnistデータを知っている場合、250しか使用しなかったため、精度が83から96%に上がりました。事実は、より多くの次元がより多くの問題をもたらすということです。だからそれらを切断します。私は通常、情報の90%しか保持していないKのみを使用します。