「ローディング」と呼ばれる因子分析モデルの回帰係数がなぜですか?


7

では、このスレッド@ttnphns書き込みます

これは回帰係数なので[...]「変数負荷係数」よりも「変数負荷変数」の方がいいと主張します。

ここから、因子分析モデルは方程式系であることを学びまし

V1=a1IFI+a1IIFII+E1

V2=a2IFI+a2IIFII+E2

...

Vp=

ここで、係数aは負荷、Fは係数[...]、変数Eは回帰残差です。

しかし、その逆ではなく、「ファクターロード変数」と言うべきだとは言えません。「ローディング」という用語について、それを後にするのは何ですか?

また、すでに「回帰係数」という用語があったのに、なぜ「ローディング」という用語が必要なのかまったくわかりません。それは、回帰係数が相関係数を兼ねることもあり、統計学者が両方のケースをカバーする総称的な用語を必要としていたからですか?

この質問に対する答えが、学生が因子が観測された変数をロードするのではなく、その逆であることを覚えやすくなることを願っています。


1
「何をロードする」(または何をロードするのか、何をロードするのかなど)何を思い出すことができないので、このコンテキストでは「ロードする」という動詞の使用を避けます。私は「ローディング」と言いますが。ただし、FAは回帰はなく、少なくとも通常の意味では「回帰係数」はないことに注意してください。電話するのは混乱するだけだと思いますA回帰係数。まったく何も呼び出さないか、「ローディング」と呼びます。しかし、それらは回帰係数ではありません!
アメーバ2016年

@amoeba、FA is not a regressionあなたは正しいと正しくないの両方を言っています。もちろん、抽出手順としてのFA は回帰手順ではありません。ただし、FA モデルは回帰モデルです。(おおよそのスコアではなく)真のFs値を知ることができ、フィットが優れていた場合(負荷による相関の再現を書いた場合)、それらのFsの値でVsを後退させる場合、負荷は次のようになります。パラメータ推定。
ttnphns 2016年

回答:


5

私たちは逆ではなく「ファクターロード変数」と言うべきだということがどうなるかわかりません

抽象説明。オブジェクトと見なされるポイントが、フィーチャーと見なされる軸上に座標を持っている場合、座標は、フィーチャーがポイントをロードする量、それ自体がそのポイントをチャージする量です。私の身長が1.86 mの場合、これは私が身長によってロードされる方法です(私がどれほどの高さをロードするかではありません)。ローディングは、ローディングプロットの factor-as-axis上の変数の座標であることに注意してください。

潜在特性の説明。Factorは、変数の「内」または「背後」で機能し、それらを相関させるエンティティとして概念化されています。したがって、「負荷」は、変数が潜在因子にどの程度強く依存しているか、潜在因子によって駆動されているかを直感的に表すのに適した単語です。因子分析モデルは、因子が観測変数を説明または「影響」する回帰モデルです。すべての回帰係数(因子分析だけでなく)には「負荷」というラベルが付けられます。回帰係数=回帰重み=回帰負荷。因子の係数を「負荷」と呼ぶより多くの理由は、因子モデルでは、因子がFsは標準化され、各単位分散が設定され、変数は V必ずしも標準化されているわけではありません。したがって、V完全に、負荷係数を介してのみ実現/表現されます。回帰モデルで標準化された変数が潜在的に標準化されていないものを予測するときはいつでも-係数「ローディング」を呼び出します。

「回帰係数」という用語がすでにあったのに、なぜ「負荷」という用語が必要なのか

実際には必要ありません。「ローディング」という言葉は、心理学者が比喩的な感覚を好むことに由来する単なる伝統です(FAは1世紀前に心理学者の間で発展し始めました)。さらに、「ローディング」という用語は、他の関連する多変量メソッド(判別分析など)では、統計的意味が多少異なる場合があります。一般に、「ローディング」回帰係数を呼ぶ人もいれば、相関係数を呼ぶ人もいます。したがって、この用語は紛らわしいです。結局のところ、これは統計用語ではありません。

単語が気に入らない場合は使用しないでください。必要に応じて、「可変負荷(on)係数」と言うこともできます。私にとっては、それは単なる無知なスピーチであり、悪徳ではありません。

PS私は英語の辞書に見えた(英語は私の言語ではない)とすることが観察されてきた負荷に(乗り出して袋によって、または自分で)(1)「私は、カートをロード」としての意味を有していてもよいです。(2)「船は(その上に)多くの乗客を(上に)積む」。2番目の単語の使用法に従う場合は、「変数は(それ自体に)変数をうまくロードする」と言っても問題ありません。


+1。しかし、負荷を「回帰係数」と呼ぶのは好きではありません。私にとって「回帰」とは、従属変数と独立変数があり、回帰係数を見つけることが目的であることを意味します。FAなどの潜在変数モデルでは、変数のセットは1つしかなく、目標は潜在変数を見つけることです。これは回帰ではありません。数学と計算は完全に異なります(FAソリューションを見つけるには、通常、期待値最大化のようなものが必要です。回帰ではEMは必要ありません)。私は回帰のために「回帰係数」という用語を使い続けます。
amoeba

1
This is not a regression@amoeba、私はあなたの方法があなたの方法とは少し違っていても、私はあなたがこれらの用語を理解する方法に反対しません。私たちの不一致はそれほど重要ではありません。「回帰(=回帰のような)モデル」と言うことは、「回帰(分析)」と正確に言っているわけではないことに注意してください。明らかに、外部Y変数がないため、FAは回帰ではありません。それでも、XがそれらのYであるかのように、なんとかして抽出されたFによってXをモデル化します。「回帰モデル」の観点からFAを学生に説明するのはスムーズです。
ttnphns

この用語は、以下の荷重の解釈に影響しますか?負荷の解釈は次のとおりです。1. PCの負荷が高いほど、変数の形成に影響を与えます。2.変数のローディングが高いほど、主成分スコアの形成に与える影響が大きくなります。3.両方?問題がある場合は、ここに完全に投稿してください
user_anon

1
今いいよ。1.正解です(まあ、通常はPCを正直な要素として取り上げません)。2.正解ですが、簡単ではありません。ローディングからコンポーネントスコア係数がどのように計算されるかを確認してください:stats.stackexchange.com/a/126985/3277と、ローディングからのこれらのcoef-sの違いについても説明しています:stats.stackexchange.com/a/191332/3277
ttnphns

1
@ user_anon、3)。ただし、データセットではなく確率変数に関して話す場合は、1と2の両方も有効です。通常、正規分布は必要ありません。
ttnphns 2018
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.