PLSの回帰係数の信頼区間を計算する方法は?


10

PLSの基礎となるモデルは、与えられた行列とベクトルがによって関連付けられることです ここで、は潜在的な行列、およびはノイズ項です(が中央にあると)。n×mXny

X=TP+E,
y=Tq+f,
Tn×kE,fX,y

PLSの推定値生成、および回帰係数の'ショートカット'ベクター、ように。の分布をいくつかの単純化した仮定の下で見つけたいと思います。T,P,qβ^yXβ^β^

  1. モデルは正確です。つまり 、未知のに対してです。X=TP+E,y=Tq+fT,P,q
  2. 潜在因子の数は既知であり、PLSアルゴリズムで使用されます。k
  3. 実際の誤差項は、既知の分散を持つiidゼロ平均正規です。

「the」PLSアルゴリズムには多数のバリアントがあるため、この質問はいくぶん過小評価されていますが、私はそれらの結果を受け入れます。私はまたの分布を推定する方法についての指導受け入れるだろうを経由して例えば Aのブートストラップを、おそらくそれは別の問題です。β^

回答:


9

この記事を知っていますか:PLS回帰:ケモメトリックスの基本的なツール?PLSパラメータのSEおよびCIの導出については、§3.11で説明されています。

たとえば、Abdi、Hで提案されているように、CIの計算には通常、Bootstrapを使用します。部分最小二乗回帰と潜在構造回帰(PLS回帰)への投影。Tenenhaus M.(1998)Larég​​ressionPLS:Théorieet pratique(Technip)で論じられている理論的な解決策があることを覚えているようですが、本がないので今は確認できません。今のところ、plsRglmのようないくつかの便利なRパッケージがあります。

PS私はちょうど発見したニコール・クレイマーを参照して、の記事をplsdof Rパッケージ。


2

レイスらの論文を発見しましたal。産業用のバッチ終了品質予測のための部分最小二乗信頼区間計算

PLS予測には、予測の正確さを示すオンラインの信頼区間が伴う必要があります。PLS予測の信頼区間の定式化は、「ゴールドスタンダード」を結論付けていない研究分野です。

この論文には、「そのような研究の優れた調査」への言及、FaberとBroによるマルチウェイPLSの標準誤差予測、 FaberとKowalskiによる論文、 主成分回帰によって得られた予測の検証のための測定誤差の伝播が含まれています。と部分最小二乗。これらの結果が利用可能になり次第、まとめます...


(+1)知っておくと良いです、ありがとう。ミシェル・テネンハウスの作品をもう一度見てみましょう-sthが面白いと思ったらお知らせします。
chl
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.