タグ付けされた質問 「factor-analysis」

因子分析は、相互相関変数を因子と呼ばれるより少数の連続潜在変数に置き換える次元削減潜在変数手法です。要因は相互相関の原因であると考えられています。[確認要因分析には、タグ 'confirmatory-factor'を使用してください。また、因子分析の「因子」という用語を、回帰/ ANOVAのカテゴリー予測子としての「因子」と混同しないでください。]

4
確認的要因分析で重みを1に設定するのはなぜですか?
:私は、次のドキュメントのp138-142に例を参照しながら、この質問を書くftp://ftp.software.ibm.com/software/analytics/spss/documentation/amos/20.0/en/Manuals/IBM_SPSS_Amos_User_Guide.pdf。 以下は、図と表です。 潜在変数には自然なメトリックがなく、この問題を解決するために因子負荷を1に設定することを理解しています。ただし、(完全に)理解していないことがいくつかあります。 因子負荷を1に修正すると、スケールの不確定性の問題がどのように修正されますか? なぜ他の数値ではなく1に固定するのですか? 因子->指標の回帰の重みの1つを1に固定することで、その因子に対する他のすべての回帰の重みを相対的に作成することを理解しています。しかし、特定の因子負荷を1に設定した場合、どうなるでしょうか。その場合、因子のスコアが高いほど、問題の観測された変数のスコアが低いことが予測されます。最初に因子負荷を1に設定した後、負の理解された回帰の重み、または負の標準化された回帰の重みに到達できますか? これに関連して、回帰係数と共分散の両方と呼ばれる因子負荷を見てきました。これらの定義はどちらも完全に正しいですか? なぜ、spatial-> vispercとverbal-paragrapの両方を1に修正する必要があったのですか?これらのパスの1つを1に固定した場合はどうなりますか? 標準化された係数を見て、どのようにして単語平均>文>パラグラフの非標準化係数であるのか、標準化された係数パラグラフ>単語平均>文を見ることができるでしょうか。私はパラグラップを1に固定することにより、最初に因子にロードされた他のすべての変数がパラグラップに関連するようになったと思いました。 また、関連する答えがあると想像する質問も追加します。なぜ、一意の項(たとえば、err_v-> visperc)の回帰係数を1に修正するのですか?vispercの予測でerr_vの係数が1になるとはどういう意味ですか? すべての質問に対応していなくても、大歓迎です。

3
非常に小さいサンプルサイズの次元削減手法
私は21の社会経済的および態度のマクロレベルの変数を持っています(24歳から54歳の母親の就業していない割合、3歳から5歳の子供の保育園の割合など)。私はまた、集中的な保育を提供した祖父母の割合に関するデータも持っています。私が選択したほとんどの社会経済変数は、保育提供と高い相関があります(たとえば、パートタイムで雇用されている母親の割合と祖父母保育の提供の間には負の相関があります)。 理想的には、さまざまな国の類型を作成したいと思います。私の希望は、コンポーネントや要素が直感的に理解できるようなある種の次元削減手法を使用することです(たとえば、家族や性別に対する態度、労働市場構造、家族政策)。または、代わりに、21のマクロレベルの指標のうちどれが国全体の保育規定の変動性を最もよく説明するかを評価します。 私の主な問題は、ヨーロッパの国が12か国しかないことです。PCAと因子分析は、少数のケースで適切な手法ではないと思います。私は正しいですか?質的比較分析または多重対応分析の使用を試みるように言われましたが、私の理解では、後者の手法はバイナリ(またはカテゴリ)マクロレベルのインジケーターに適しています(マイニングはパーセンテージまたは連続変数です)。

1
(因子分析における)因子負荷に基づいて、リッカート尺度項目に等しくない重みを与えることができますか?
データを収集した後、個々のアイテムスコアを合計して(そして合計をアイテム数で割って平均スコアを取得することにより)、リッカート(合計)スケール(以前は因子分析で因子として識別されていました)のスコアを計算します。その計算では、スケール内のすべてのアイテムの重量が等しいと想定しています。ただし、因子分析から、一部の項目には、そのスケールを構成する他の項目よりも大きな因子負荷があったことがわかります。したがって、彼らは差異の詳細を説明しています。それらの因子負荷を使用することにより、アイテムに等しくない重みを与えることは可能ですか?たとえば、6アイテムスケールの場合、アイテム4は他のアイテムよりもそのスケールスコアでより効果的です。 または、私の質問を言い直します:リッカートスケール(構成)の項目には等しい因子負荷がありません(その因子の分散を説明しています)が、研究者は通常、同じように重み付けされた項目でリッカートスケールを使用するのはなぜですか?

1
個々のデータセットでボックスコックス変換を使用すると、これらのデータを比較できなくなりますか?
ソフトウェア作成者が推奨するように、ボックスコックス変換を使用してデータを正規化し、生態学的ニッチ因子分析ソフトウェアに入力しました。 しかし、ボックスコックス変換メソッドが(明らかに!)変換ごとに異なるラムダ値を選択していることに気付きました。たとえば、4つのサンプル日付の個々の場所に対する因子A、B、およびCの影響を比較したいとします。各因子は個別にボックスコックス化されています(他の因子および他の日付とは別に)。これは、各変換に異なるラムダ値を選択しているため、各因子分析の結果が比較できない(そして、ANOVAなどによる変換データの単純な比較ができない)ことを意味しますか?

1
動的因子分析と差異の因子分析
私は動的要因分析に頭を抱えようとしています。これまでのところ、私の理解では、DFAは因子分析とスコアの時系列モデルにすぎません(負荷は固定されたままです)。ただし、私が見たケースでは、スコアのモデルは対角相関行列を使用した単なるランダムウォークです。これは、違いに適用された通常の因子分析と同じようです。何が欠けていますか? 私を始めるための良い参考文献を知っているなら、私はそれらに感謝します。負荷がゆっくりと変化することを可能にするものを実際に見つけたいです。それについて考えるための私のコンテキストは、West&HarrisonスタイルのDLMです。

3
ランキングと評価スケールを一緒に分析する方法は?
一部の市場調査では、消費者は優先度に基づいて製品の機能をランク付けするよう求められています。例えば、 優先度に基づいてデバイスの以下の機能をランク付けします(1が最優先) Storage capacity 6 Portability 5 Touch interface 1 Keyboard 4 Long battery life 2 Entertainment on the go 3 重要度に基づいて機能を1〜5のスケールで評価します(1は非常に重要です) 1 2 3 4 5 Storage capacity 1 Portability 3 Touch interface 1 Keyboard 1 Long battery life 2 Entertainment on the go 4 次に、ランキングと評価に基づいて、重みを割り当て、最終的に消費者がラップトップまたはタブレットPCのどちらを好むかを調べます。 この例で、消費者がタッチを1、バッテリー寿命を2とランク付けしたとします。これらはタブレットの属性です。しかし、彼はキーボードとストレージ容量を最も重要であると評価しました。これはキーボードを備えたラップトップの機能です。 これらを組み合わせて、おそらくいくつかの重みを割り当ててスコアを出すにはどうすればよいですか?スコアが特定のレベルを上回っている場合、消費者はタブレットを好み、特定のレベルを下回っている場合、消費者はラップトップを好みます。

2
確認的因子分析のための適合度の悪い統計の後に何をすべきか?
環境 博士論文に問題があります。私の論文は、組織の文化と組織の信頼レベルについての認識を通じて、中等学校の教師の組織市民活動を調査することです。 私には871人の教師のサンプルがあります。私は3つの機器を持っていますが、それらは他の研究者によって開発され、他のいくつかの研究で使用されました。 構造方程式モデリングを使用してデータを分析しようとしています。ただし、確認的要因分析を行う際、1つの手段(組織市民権)のみで問題はありませんでした。他の2つの機器は、一次確認分析を提供しませんでした。RMSEA値は約0.100でした。カイ二乗が高すぎ、自由度で割ったカイ二乗も高すぎました。 質問 機器とCFAをどうすればよいですか? これらの楽器からアイテムをパーセルするか、アイテムを削除することは良い考えでしょうか? または、構造方程式モデリングをスキップして回帰を続行する必要がありますか?

5
ベイズ因子分析に関する論文?
私は、因子分析のようなモデルを資産の収益や他の同様の潜在変数モデルに当てはめることに興味があります。このトピックについて読むのに適した紙は何ですか?因子分析モデルが「因子負荷」の符号変更の下で同一であるという事実を処理する方法に特に興味があります。

4
FA:「単純構造基準」に基づく回転行列の選択
因子分析を使用する上で最も重要な問題の1つは、その解釈です。因子分析では、解釈を強化するために因子ローテーションがよく使用されます。満足のいく回転の後、回転した因子負荷行列L 'は相関行列を表す同じ機能を持ち、回転していない行列Lの代わりに因子負荷行列として使用できます。 回転の目的は、回転した因子負荷行列にいくつかの望ましい特性を持たせることです。使用される方法の1つは、回転する行列が単純な構造になるように因子負荷行列を回転させることです。 LL Thurstoneは、因子回転の一般的なガイドとして、単純構造の原理を導入しました。 単純な構造基準: 因子行列の各行には少なくとも1つのゼロが含まれている必要があります 共通因子がm個ある場合、因子行列の各列には少なくともm個のゼロが必要です 因子行列の列のすべてのペアについて、1つの列ではエントリがゼロに近づくが、他の列ではエントリに近づかない変数がいくつかあるはずです。 因子行列のすべての列のペアについて、4つ以上の因子がある場合、変数の大部分は両方の列でゼロに近いエントリを持つ必要があります 因子行列の列のペアごとに、両方の列にゼロ以外のエントリを持つ少数の変数のみが存在する必要があります 理想的なシンプルな構造は次のようなものです。 各アイテムには、1つの要素のみで高い、または意味のある負荷があり、 各要素には、一部の項目のみの高い、または意味のある負荷があります。 問題は、回転メソッドのいくつかの組み合わせと、それぞれが受け入れるパラメーター(特に、斜めのパラメーターの場合)を試すと、候補行列の数が増え、上記の基準をどれがより適切に満たすかを確認することが非常に難しいことです。 最初にその問題に直面したとき、私はそれらを単に「見る」だけでは最良の一致を選択することができず、決定を助けるためのアルゴリズムが必要であることに気付きました。プロジェクトの締め切りのストレス下で、私ができることのほとんどは、MATLABで次のコードを書くことでした。これは、一度に1つの回転行列を受け入れ、各基準が満たされているかどうかを(いくつかの仮定の下で)返します。新しいバージョン(アップグレードしようとした場合)は、3dマトリックス(2dマトリックスのセット)を引数として受け入れ、アルゴリズムは上記の基準により適合するものを返す必要があります。 これらの基準からアルゴリズムをどのように抽出しますか?私はあなたの意見(メソッド自体の有用性についての批判もあったと思います)とおそらくローテーションマトリックス選択問題へのより良いアプローチを求めています。 また、FAを実行したいソフトウェアを教えてください。Rの場合、どのパッケージを使用しますか?(私がFAをしなければならなかった場合、私は再びSPSSに目を向けることを認めなければなりません)。誰かがコードを提供したい場合は、RまたはMATLABを使用します。 上記PSザ・シンプルな構造基準製剤は、本の中で見つけることができる「因子分析の感覚を作る」 PETT、M.、ラッキー、N.、SULLIVAN、J.によって PS2(同じ本から):「成功した因子分析のテストは、元のコアマトリックスを再現できる範囲です。斜めの解法も使用した場合は、すべての中で最高および最低因子の最大数を生成したものを選択してください。ローディング。」 これは、アルゴリズムが使用できる別の制約のように聞こえます。 PS3この質問はここでも尋ねられました。しかし、私はそれがこのサイトによりよく合うと思います。 function [] = simple_structure_criteria (my_pattern_table) %Simple Structure Criteria %Making Sense of Factor Analysis, page 132 disp(' '); disp('Simple Structure Criteria (Thurstone):'); disp('1. Each row of the factor …

2
因子分析について
因子分析は次のように理解できますか? 5つの独立変数(A、B、C、D、E)があるとします 因子分析により、(D、E)を従属変数にしたり、(A、B、C)の線形結合にすることができます。 したがって、必要なのは(A、B、C)データと行列のみであり、data(A、B、C)と行列によってデータ(D、E)を再作成できます。ΛΛ\LambdaΛΛ\Lambda データ削減のみを行います。私は正しいですか?

2
科学的に健全なスケール構築に関するアドバイス
組織研究の分野で、20のリッカートアイテム(1〜5、サンプルサイズn = 299)のセットが与えられました。これらのアイテムは、多面的で多面的であり、本質的に異質である潜在的な概念を測定することを目的としています。目標は、さまざまな組織の分析に使用でき、ロジスティック回帰で使用できるスケールを作成することです。アメリカの心理学協会に従って、スケールは(1)一次元、(2)信頼でき、(3)有効でなければなりません。 したがって、それぞれ4/6/6/4アイテムの4つの次元またはサブスケールを選択することにしました。コンセプトを表すと仮定されています。 アイテムは、リフレクトアプローチを使用して構築されました(可能なアイテムの多くを生成し、その後の3つのグループでcronbachのアルファおよび概念表現(有効性)を使用してアイテムを繰り返し削除します)。 利用可能なデータを使用して、ポリコリック相関に基づく予備的な並列説明因子分析とバリマックスローテーションを使用すると、アイテムが予想とは異なる他の因子にロードされていることが明らかになりました。4つの仮説とは異なり、少なくとも7つの潜在要素があります。項目間相関の平均は、正ではありますがかなり低い(r = 0.15)。cronbach-alpha係数も、各スケールで非常に低い(0.4〜0.5)。確認的因子分析が適切なモデルフィットをもたらすとは思えません。 2つの次元が削除された場合、cronbachsアルファは受け入れられます(スケールあたり10アイテムで0.76,0.7、これはcronbachsアルファの通常バージョンを使用することでさらに大きくすることができます)が、スケール自体は依然として多次元です! 私は統計に不慣れで適切な知識が不足しているため、さらに先に進む方法に困っています。スケールを完全に破棄し、説明のみのアプローチに辞任することに消極的であるため、さまざまな質問があります。 I)信頼でき、有効であるが一次元ではないスケールを使用することは間違っていますか? II)その後、概念を形成的であると解釈し、消失四面体テストを使用してモデル仕様を評価し、部分最小二乗(PLS)を使用して可能な解決策に到達するのは適切でしょうか?結局のところ、この概念は反射的なものよりも形成的なもののようです。 III)項目応答モデル(Rasch、GRMなど)を使用することは役に立ちますか?私が読んだように、ラッシュモデルなども一次元性の仮定が必要です IV)7つの要素を新しい「サブスケール」として使用するのが適切でしょうか?古い定義を破棄し、因子負荷に基づいて新しい定義を使用するだけですか? 私はこれについての考えをいただければ幸いです:) 編集:追加された因子負荷と相関 > fa.res$fa Factor Analysis using method = ml Call: fa.poly(x = fl.omit, nfactors = 7, rotate = "oblimin", fm = "ml") 因子パターン行列と因子相互相関行列から計算された因子負荷、0.2を超える値のみが表示されます

1
因子負荷は、アイテムの回答オプションの範囲によって支配されるべきですか?
1〜5の合意項目と0/1の「当てはまるものをすべて選択」項目で探索的要因分析が行われる場合、理論的には、1〜5項目が1つまたは2つの要因にかかる偽の傾向がどの程度あるか1つまたは2つの要素の別のセットにロードする0/1アイテム?(同様のスケールのアイテム間では相関がはるかに高くなる傾向があるという考えの賛否両論を聞いたことがあります。私自身の実験/シミュレーションではあまり効果がありませんでした。)

1
SEMのインターセプトの直感的な定義/説明とは何ですか?
私の友人/同僚の何人かは最近、構造方程式モデリングに関心を持っており、SEMについてますます多くの質問に答える必要があります。多くの場合、これらの質問は、さまざまな測定モデルパラメーター(つまり、因子負荷、残差分散、切片)の推定値の意味を解釈する方法、およびこれらの値がグループ間でほぼ等しいことが重要である理由(つまり、推定された構造パラメーター(すなわち、分散、共分散、および平均)でグループを比較する前に、測定の不変性を確立します。 因子負荷と残差分散のアクセス可能な定義、および構造パラメーターのグループを比較する前にこれらの推定パラメーターがグループ間で同等であることが重要である理由についてのアクセス可能な説明を提供することについて、私はかなり良いハンドルを持っているように感じます。しかし、何らかの理由で、私は同様にアクセス可能な定義のように感じ、切片の説明が私を逃れました。 だから、私の質問は、切片とは何かをアクセシブルに説明する最善の方法であり、グループの潜在的手段を比較する前に切片がグループ間で不変であることが重要である理由を説明するのですか? 例:因子負荷は、観測変数と潜在変数の間の関連の推定方向と強さを表します。言い換えると、因子負荷は、その観測された変数が、関連する潜在変数の発現に対してどれほど中心的であるかを表します。グループを比較すると構造パラメータを、ので、それは、彼らがグループ間で不変であることを確認することが重要です与えられた潜在変数の理解、それ以外の場合は、同じ観測変数が両方のグループにも同じように重要ではないことを示唆している-潜在変数の手段何か違います各グループに。 それに関連する潜在変数がゼロに等しいときの切片があるもの...与えられた観測変数の期待値であり、換言すれば、...と、それらが不変であることを確認することが重要です、なぜなら...の説明の部分解釈(SEMのコンテキストで)?

1
「ローディング」と呼ばれる因子分析モデルの回帰係数がなぜですか?
では、このスレッド@ttnphns書き込みます これは回帰係数なので[...]「変数負荷係数」よりも「変数負荷変数」の方がいいと主張します。 ここから、因子分析モデルは方程式系であることを学びました V1=a1IFI+a1IIFII+E1V1=a1IFI+a1IIFII+E1V_1 = a_{1I}F_I + a_{1II}F_{II} + E_1 V2=a2IFI+a2IIFII+E2V2=a2IFI+a2IIFII+E2V_2 = a_{2I}F_I + a_{2II}F_{II} + E_2 ......... Vp=…Vp=…V_p = … ここで、係数aは負荷、Fは係数[...]、変数Eは回帰残差です。 しかし、その逆ではなく、「ファクターロード変数」と言うべきだとは言えません。「ローディング」という用語について、それを後にするのは何ですか? また、すでに「回帰係数」という用語があったのに、なぜ「ローディング」という用語が必要なのかまったくわかりません。それは、回帰係数が相関係数を兼ねることもあり、統計学者が両方のケースをカバーする総称的な用語を必要としていたからですか? この質問に対する答えが、学生が因子が観測された変数をロードするのではなく、その逆であることを覚えやすくなることを願っています。
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.