RのキャレットパッケージでPCAを使用して前処理するときの主成分の数


11

caretパッケージRをバイナリSVM分類器のトレーニングに使用しています。機能を削減するためにpreProc=c("pca")、呼び出し時に組み込み機能を使用してPCAで前処理していtrain()ます。ここに私の質問があります:

  1. キャレットはどのように主成分を選択するのですか?
  2. 選択された主成分の数は決まっていますか?
  3. 主成分は、ある程度の説明された差異(80%など)によって選択されていますか?
  4. 分類に使用する主成分の数を設定するにはどうすればよいですか?
  5. (PCAは信頼できる予測推定を可能にするために外部相互検証の一部であるべきことを理解しています。)PCAは内部相互検証サイクル(パラメーター推定)にも実装する必要がありますか?
  6. キャレットは相互検証でPCAをどのように実装しますか?

回答:


13

デフォルトでは、キャレットは分散の95%を説明するコンポーネントを保持します。
ただし、threshパラメーターを使用して変更できます。

# Example
preProcess(training, method = "pca", thresh = 0.8)

pcaCompパラメータを設定して、特定の数のコンポーネントを設定することもできます。

# Example
preProcess(training, method = "pca", pcaComp = 7)

両方のパラメータを使用する場合、pcaCompがに優先しthreshます。

ご覧ください:https : //www.rdocumentation.org/packages/caret/versions/6.0-77/topics/preProcess


残念ながらリンクは壊れています
R Kiselev '28

リンクを修正
Jacques Wainer 2017
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.