PCAは値を処理しますが、CAは相対値を処理します。どちらも、あなたが言及する種類の相対的な存在量のデータには問題ありません(1つの重要な注意点があります。後で参照)。%データを使用すると、すでに相対測定値がありますが、それでも違いがあります。自問してみてください
- 豊富な種/分類群(すなわち、%カバーが大きいもの)のパターンを強調しますか、または
- 相対的構成のパターンに焦点を当てたいですか?
前者の場合は、PCAを使用します。後者がCAを使用する場合。2つの質問の意味は、
A = {50, 20, 10}
B = { 5, 2, 1}
異なるまたは同じと見なされるには?A
およびB
は2つのサンプルであり、値は表示されている3つの分類群の%coverです。(この例はうまくいかず、地表があると仮定します!;-) PCAはユークリッド距離を使用しているため、これらを非常に異なるものと見なしますが、CAはこれらの2つのサンプルは、相対プロファイルが同じであるため非常に類似していると見なします。
ここでの大きな警告は、データの閉じた構成の性質です。合計が1(100%)になるいくつかのグループ(Sand、Silt、Clayなど)がある場合、どちらのアプローチも正しくなく、クローズドコンポジション用に設計されたAitchisonのLog-ratio PCAを介してより適切な分析に移行できます。データ。(これを行うには、行と列で中央揃えし、データをログ変換する必要があります。)他のアプローチもあります。Rを使用する場合に役立つ1つの本は、Rを使用した構成データの分析です。