ランクの低下回帰と主成分回帰は、部分最小二乗の特別な場合にすぎませんか?
このチュートリアル(6ページの「目的の比較」)では、XまたはYを投影せずに部分最小二乗(つまり「部分的ではない」)を行うと、ランク回帰または主成分回帰に対応するようになると述べています。
このSASドキュメントページのセクション「ランクの回帰の削減」および「メソッド間の関係」で同様の記述が行われています。
より基本的なフォローアップの質問は、それらが同様の基礎となる確率モデルを持っているかどうかです。
ランクの低下回帰と主成分回帰は、部分最小二乗の特別な場合にすぎませんか?
このチュートリアル(6ページの「目的の比較」)では、XまたはYを投影せずに部分最小二乗(つまり「部分的ではない」)を行うと、ランク回帰または主成分回帰に対応するようになると述べています。
このSASドキュメントページのセクション「ランクの回帰の削減」および「メソッド間の関係」で同様の記述が行われています。
より基本的なフォローアップの質問は、それらが同様の基礎となる確率モデルを持っているかどうかです。
回答:
これらは3つの異なる方法であり、いずれも別の特殊なケースと見なすことはできません。
正式に、もし及び予測子を中心(れる)及び応答()データセット、我々は軸の最初のペアを探している場合のための及びV ∈ Rの Q用Y、次いで、これらの方法は以下の量を最大化します。Y N × P N × Q W ∈ R P X
(このリストに正準相関分析(CCA)を追加しました。)
SASでは、3つのメソッドすべてがPROC PLS
、異なるパラメーターを持つ同じ関数を介して実装されているように見えるため、混乱が生じているのではないかと思います。したがって、3つのメソッドはすべてPLSの特殊なケースであるように見えるかもしれません。これがSAS関数の名前の付け方だからです。ただし、これは残念なネーミングです。実際には、PLS、RRR、およびPCRは、何らかの理由でが呼び出される1つの関数でSASに実装される3つの異なる方法ですPLS
。
リンクした両方のチュートリアルは、実際にそれについて非常に明確です。プレゼンテーションチュートリアルの6ページには、3つの方法すべての目的が記載されており、質問で主張した内容に反して、PLSがRRRまたはPCRに「なる」とは書かれていません。同様に、SASのドキュメントでは、3つの方法が異なり、式と直感を提供していると説明しています。
[P]主成分分析は、可能な限り多くの予測変数を説明する因子を選択し、低ランク回帰は、可能な限り多くの応答変動を説明する因子を選択し、部分最小二乗は2つの目的のバランスをとり、応答と予測変数の両方を説明する因子を探します。
SASのドキュメントには、3つの方法が異なるソリューションを提供する素晴らしいおもちゃの例を示す図もあります。このおもちゃの例には、2つの予測子およびx 2と1つの応答変数yがあります。内方向Xの最もに相関しているYはの最大分散の方向と直交するようにたまたまX。したがって、PC1は最初のRRR軸に直交し、PLS軸はその中間にあります。
RRR損失関数にリッジペナルティを追加して、リッジ減少ランク回帰またはRRRRを取得できます。これにより、回帰軸がPC1方向に引っ張られます。これは、PLSが行っていることに多少似ています。ただし、RRRRのコスト関数はPLS形式で記述できないため、異なるままです。