PLS回帰とPLSパスモデリングの違い。PLSの批判


11

この質問はここで行われましたが、誰も良い答えを出しませんでした。ですから、もう一度提示するのは良い考えだと思います。また、コメントや質問をさらに追加したいと思います。

  • 最初の質問は、「PLSパスモデリング」と「PLS回帰」の違いは何ですか?より一般的に言えば、構造方程式モデリング(SEM)、パスモデリング、回帰とは何ですか?私の理解では、回帰は予測に重点を置いていますが、SEMは応答と予測子の関係に重点を置いており、パスモデリングはSEMの特別なケースですか?

  • 2つ目の質問は、PLSはどの程度信頼できるかということです。最近、Rönkköet al。で強調されたように、多くの批判の対象となっています。2016およびRönkköet al。2015のような高ティア誌にPLSに基づいて論文の拒否にどのリード運用管理のジャーナルここでは雑誌編集者からの注記があります):

    PLSは例外なく、OM研究者が使用するモデルの種類におけるモデリングアプローチ間違っていると結論付けたため、実質的にすべてのPLSベースの原稿を拒否しています

    私の分野は分光学であり、管理/心理学や統計学ではありません。上記でリンクされた論文では、著者はSEM法としてのPLSについてより多く話しているが、私には、彼らの批判はPLS回帰にも当てはまると思われる。


リンクはすべてペイウォールの背後にあります。
ジェレミーマイル

あなたは、絶対に正しい!申し訳ありません。PDFはありますが、アップロードまたは共有できるかどうかはわかりません。科学は自由であるべきです:)
Res

PLS回帰については、stats.stackexchange.com/questions/179733でかなり詳しく説明されています。残念ながら、「パスモデリング」についてはほとんど何も知りません。
アメーバ2018

「パスモデリング」はSEMの別の名前だと思います
rep_ho

2016年の論文から:「重みの目的に関するPLSの光沢に関するほとんどの紹介文。PLSはSEMであり、したがって、複合による回帰(たとえば、Gefen et al。、2011)に比べて利点があるはずだと主張しているが、そのような作品多くの場合、PLS自体もコンポジットの単なる回帰であることを明示的に指摘していません。」誤解を招く。議論の主な目的は、SEMが純粋な理論的構造でなければならず、経験的に導出された構造方程式を軽視していると著者が主張していることです。しかし、PLSは共分散によって「構造化」方程式を導き出します。
ReneBt

回答:


8

最初の質問は、「PLSパスモデリング」と「PLS回帰」の違いは何ですか?

なし、同義語です。

より一般的に言えば、構造方程式モデリング(SEM)、パスモデリング、回帰とは何ですか?私の理解では、回帰は予測に重点を置いていますが、SEMは応答と予測子の関係に重点を置いており、パスモデリングはSEMの特別なケースですか?

SEMは回帰の形式です。回帰は、独立変数と従属変数を相互に関連付ける任意のメソッドであり、個別のエンティティとして処理される複数の変数を使用するメソッドが含まれます。SEMは特に変数間の数学的関係を使用して最終モデルを制約します。PLSの場合、これは共分散です。私の理解では、パスモデリングはドメイン(私のものではなく、私はあなたのような分光学者です)固有の用語です。

2つ目の質問は、PLSはどの程度信頼できるかということです。最近、Rönkköet al。で強調されているように、多くの批判の対象となっています。2016およびRönkköet al。2015年

優れた反論は、Henselerらにあります。2013 PLSに関する一般的な信念と現実。Rönkköらの主な懸念事項。PLSは、共通の潜在的な要因を想定するいくつかの状況ではうまく機能しなかったということです。PLSは実際には複数の潜在的要因を処理するように設計されていますが、これは現実の世界でははるかに一般的な状況です。

どのくらい信頼できますか?分光法にとっては優れたツールですが、限界があります。複数の根本的な要因からの寄与を取り込む複雑なモデルを構築できるため、過剰適合のリスクが発生します。このため、注意して使用する必要があり、適切な外部検証が不可欠ですが、これらの警告はすべてのモデル構築ツールに適用されます。私は主に20年間実世界のデータセットを扱っており、従属変数の基礎となる共通の要因が1つしかない実験データセットはありませんでした(データにも科学理論にも基づいていません)。


1
+1は、この回答にRonkkoらの詳細が含まれていることを望みますが。vs Henseler et al。不一致。私は分光法学者ではありませんが、線形回帰の正則化手法としてのPLSについては比較的よく理解しています(それがHastie によるThe Elements of Statistical Learningでの提示方法です)。ケモメトリックスではPLS1と呼ばれていると思います。ここで「パフォーマンス」は再構成エラーに関係し、交差検証を使用して正則化強度を選択できます。これは、リッジ回帰またはPCRなどに遭遇した人には非常によく知られた設定です。
アメーバ2018

[続き]複数の従属変数を持つPLS2も知っていますが、これがどのくらいの頻度で使用されるかはわかりません。同時に、ロンッコ他のことを理解しようとすることから。つまり、「SEM」の焦点は、複数のXを複数のYに関連付けること(それがPLS2なのか)に専らあり、Yの予測そのものではなく、XとYの関係を解釈することに重点を置いているようです。彼らが「パフォーマンス」によって何を意味するのかさえわからないし、彼らがPLSを批判するとき、彼らがPLSの代わりに何を使うことを好むのか私はわかりません。
アメーバ2018

ReneBTとamoebaの両方に感謝します。私はRedditの上で、この質問を投稿ここで、誰か(soumya_ray)が回帰し、SEMは根本的に異なっていると答えました。彼女は技術的な違いを説明しませんでした。ところで、彼女の答えはあなたが言ったことに反対です(あなたの答えは私には理にかなっています)。
回答:

ところで、私はPLSを使用して帯域選択を行います。(テストとキャリブレーションの両方で)良好な予測が得られる可能性がある一方で、PLSパフォーマンスに関するあなたのポイントを確認しますが、モデルは根本的に間違っているか、少なくとも、応答変数。
回答

著者によって提起された主要な問題についてのさらなるコメントは次のとおりです。グローバル最適の達成を保証するものではありません。」有効な懸念事項です。つまり、モデルは同じ基になる共分散構造を持つ母集団にのみ適用されるということです。これはPLSを無効にすることはありませんが、注意してモデルを構築して使用する必要があることを意味します。
ReneBt
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.