10個の変数で構成されるデータセットがあります。部分最小二乗(PLS)を実行して、これらの10個の変数によって単一の応答変数を予測し、10個のPLSコンポーネントを抽出して、各コンポーネントの分散を計算しました。元のデータでは、702であるすべての変数の分散の合計を取った。
次に、各PLSコンポーネントの分散をこの合計で割って、PLSで説明される分散のパーセンテージを得ました。驚くべきことに、すべてのコンポーネントを合わせると、元の分散の44%しか説明されません。
その説明は何ですか?100%じゃないですか?
私が応答側で知っているように(y)PLSコンポーネントの数を決定するのは、観測の最小数です。20の観測があります。しかし、その一方で、10個の独立変数があるため、10個のPLSに制限されます。私の質問は、各コンポーネント(PLSまたはPCA)によって説明された分散を計算するための一般的な式は何ですか。
—
Res
mathworks.com/help/stats/plsregress.htmlこの例では、Y側に変数が1つだけあり、10個のコンポーネントを計算します。
—
Res