のcaret
パッケージR
をバイナリSVM分類器のトレーニングに使用しています。機能を削減するためにpreProc=c("pca")
、呼び出し時に組み込み機能を使用してPCAで前処理していtrain()
ます。ここに私の質問があります:
- キャレットはどのように主成分を選択するのですか?
- 選択された主成分の数は決まっていますか?
- 主成分は、ある程度の説明された差異(80%など)によって選択されていますか?
- 分類に使用する主成分の数を設定するにはどうすればよいですか?
- (PCAは信頼できる予測推定を可能にするために外部相互検証の一部であるべきことを理解しています。)PCAは内部相互検証サイクル(パラメーター推定)にも実装する必要がありますか?
- キャレットは相互検証でPCAをどのように実装しますか?
RのPCAとキャレットパッケージのk分割交差検証に関する有用な情報がこの投稿にあります。
—
Ekaba Bisong 2016