部分最小二乗(PLS)回帰のモデル仮定


13

PLS回帰の仮定に関する情報(単一)を見つけようとしています。特に、OLS回帰の前提に関するPLSの前提の比較に興味があります。 y

PLSのトピックに関する多くの文献を読んだり、読み飛ばしたりしました。Wold(Svante and Herman)、Abdi、および他の多くの論文ですが、満足できる情報源は見つかりませんでした。

ウォルド等。(2001)PLS回帰:ケモメトリックスの基本ツールはPLSの仮定に言及していますが、それだけに言及しています

  1. Xは独立している必要はありませんが、
  2. システムは、いくつかの潜在的な潜在変数の関数です。
  3. システムは分析プロセス全体で均一性を示す必要があります。
  4. 測定誤差は許容範囲です。 バツ

観測されたデータの要件やモデルの残差に関する言及はありません。誰もがこれに対処するソースを知っていますか?(と間の共分散を最大化する目的で)基礎となる数学がPCAに類似していると考えると、多変量正規性は仮定ですか?モデルの残差は分散の均一性を示す必要がありますか?yバツyバツ

また、観測は独立している必要はないことをどこかで読んだと思います。これは、反復測定研究の意味で何を意味しますか?


ウォルドへのリンク。他は間違っています。これはあるべきものですか?libpls.net/publication/PLS_basic_2001.pdf
emudrak

クライアントは、「直線性の仮定を確認したことを示す」という何かの行を書いた論文へのレビュアーのコメントがありました。どうしますか?
emudrak

回答:


5

標準的なOLS回帰にはいくつかの仮定があると言うとき、これらは、例えば、それが最良の線形不偏推定量であるなど、OLS推定量の望ましい特性を導き出すために必要であることを意味します-Gauss-Markovの定理と優れた答えを参照してください中@mpiktasによる線形回帰のための通常の仮定の完全なリストとは?何仮定は、単純に後退するために必要とされていない上の。仮定は、最適性ステートメントのコンテキストでのみ表示されます。yバツ

より一般的には、「仮定」は理論的な結果(定理)のみが持つことができるものです。

yバツ

さらに、PLS回帰の実際の結果は、正規化パラメーターとして機能するモデルに含まれるPLSコンポーネントの数に依存します。このパラメータを選択する手順が完全に指定されている(そして通常は指定されていない)場合にのみ、仮定について話すことは意味があります。したがって、PLSには最適性の結果はまったくないと思いますつまり、PLS回帰には仮定がありません。同じことが、主成分回帰やリッジ回帰など、他のペナルティ付き回帰方法にも当てはまると思います。

更新:リッジ回帰の前提とは何か、そしてそれらをどのようにテストするかに対する回答でこの議論を拡大しましたか?

もちろん、PLS回帰が有用である可能性高い場合とそうでない場合を示す経験則がまだあります。議論については、上記のリンクにある私の回答をご覧ください。PLSRの経験豊富な実務家(私は彼らの1人ではありません)は確かにそれ以上のことを言うことができます。


サンプリングの正常性と独立性はどうですか?
WCMC

3

どうやら、PLSは変数の共同分布について「ハード」な仮定をしていません。これは、適切なテスト統計を慎重に選択する必要があることを意味します(変数分布へのこの依存性の欠如は、PLSをノンパラメトリック手法として分類すると仮定します)。適切な統計について私が見つけた提案は、1)従属潜在変数にr-2乗を使用すること、2)推定の安定性を評価するためのリサンプリング方法です。

OLS / MLSとPLSの主な違いは、前者は通常、母集団パラメーターの最尤推定を使用して変数間の関係を予測するのに対し、PLSは真の母集団の変数の値を推定して、変数グループ間の関係を予測する(予測子/潜在変数を持つ応答変数)。

また、複製/反復実験、特に多因子実験の処理にも興味がありますが、PLSを使用してこれにアプローチする方法がわかりません。

部分最小二乗法ハンドブック:概念、方法、およびアプリケーション(ページ659、セクション28.4)

ウォルド、H。2006。予測仕様。統計科学百科事典。9。

http://www.rug.nl/staff/tkdijkstra/latentvariablesandindices.pdf(ページ4および5)

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.