私の免責事項:この質問はしばらくの間休眠状態にあったことを認識していますが、それは重要なものであり、あなたが複数の応答を引き出すことを意図したもののようです。私は社会心理学者であり、その音から、おそらくそのようなデザインにはヘンリックよりも少し快適です(ただし、因果解釈に関する彼の懸念は完全に正当です)。
SEMはどのような条件下で適切なデータ分析手法ですか?
私にとって、この質問は実際には2つの異なるサブ質問に実際に到達します。
- そもそもSEMを使用するのはなぜですか?
- 研究者がSEMの使用を決定した場合、SEMを使用するためのデータ関連の要件は何ですか?
そもそもSEMを使用するのはなぜですか?
SEMは、他のより一般的な一般的な線形モデリングアプローチ(ANOVA、相関、回帰、およびそれらの拡張など)よりも、より微妙で複雑であり、したがってアクセスしにくい-データ分析へのアプローチです。これらのアプローチで考えられることは何でも、SEMでできます。
そのため、最初にSEMを使用せざるを得ない理由を最初に強く評価する必要があると思います。確かに、SEMはそのユーザーにいくつかの強力な利点を提供しますが、これらの利点のいずれも利用されていない論文をレビューしました。 。SEMと他のデータ分析アプローチの利点が得られない場合、研究者にとっても読者にとっても、単に面倒なだけの価値はありません。
それでは、SEMアプローチの主な利点は何だと思いますか?私の意見では、大きなものは次のとおりです。
(1)潜在変数のモデリング:SEMにより、ユーザーは、観察されていない潜在変数間の構造関係(分散、共分散/相関、回帰、グループ平均差)を調べることができます。生徒が使用する可能性のある測定)。
潜在変数(例:潜在不安)と観察されたコンストラクトのスコア(例:不安項目の平均)を分析するための大きなセールスポイントは、潜在変数にエラーがないことです-潜在変数は共有共分散で形成され、そして、エラーは何も伴わないように理論化されています。これは、ユーザーがモデリングしようとしている効果を減衰させる測定の信頼性を心配する必要がなくなるため、統計力が向上することを意味します。
SEMの使用を検討するもう1つの、より控えめな理由は、場合によっては、コンストラクトに関する理論をテストする、コンストラクトに対して有効な方法です。たとえば、生徒が3つの異なる不安の尺度を使用している場合、これらの3つの尺度が持つ共通の原因(結果は不安)を、SEMフレームワークで、特権を与えるのではなく、理解する方が良いでしょうか?特定の一つの指標不安の尺度?
(2)複数の従属変数のモデリング:誰かがSEMを使用して潜在変数をモデル化しない場合でも、1つのモデルで複数の結果変数を同時に分析するためのフレームワークとして非常に役立ちます。たとえば、おそらくあなたの生徒は、同じ予測因子が、さまざまな臨床的に関連する結果(不安、抑うつ、孤独、自尊心など)にどのように関連しているかを調べることに興味があります。関心のある4つの結果すべてに対して1つのモデルを実行できるのに、なぜ4つの個別のモデルを実行する(タイプIエラー率が増加する)のですか?これは、複数の依存する回答者が予測と結果の両方の応答を生成する特定の種類の依存データを処理するときにSEMを使用する理由でもあります(たとえば、ダイアディックデータ。Kenny、Kashy、およびCook、2006年を参照)。
(3)仮定を作成する代わりに、モデリングの仮定:データ分析に対する他の多くのアプローチ(ANOVA、相関、回帰など)を使用して、扱うデータの特性(例えば、分散/同相性。SEM(通常、潜在変数アプローチと組み合わせて)を使用すると、ユーザーは平均および/または相関/回帰経路とともに分散パラメーターを同時に実際にモデル化できます。これは、ユーザーが単に変動性を厄介な仮定関連の後付けとして扱うのではなく、平均差/共変動性に加えて、変動性に関する仮説の理論化と仮説の検証を開始できることを意味します。
ある変数のグループ平均レベルを比較する場合、別のテスト可能な仮定は、その変数が実際に各グループに対して同じことを意味するかどうかです- 測定不変性と呼ばれます -SEM文献でます(このプロセスのレビューについては、Vandenberg&Lance、2000を参照してください) )。その場合、その変数の平均レベルの比較は有効ですが、グループが何かについての理解が大幅に異なる場合、グループ間の平均レベルの比較は疑わしいです。グループ比較を使用した研究では、常にこの特定の仮定を暗黙的に行います。
そして、アイテムスコアを平均化または合計して(たとえば、不安尺度で)集計インデックスを作成すると、各アイテムが基礎となる構造の同等に優れた尺度であるという仮定があります(各アイテムは平均化/合計)。SEMは、アイテムごとに異なる因子負荷値(アイテムと潜在変数の間の関連付け)を推定することにより、潜在変数が使用されている場合にこの仮定を排除します。
最後に、データに関する他の仮定(例:正常性)は、SEMにとって依然として重要ですが、データが満たされなかった場合に管理できます(たとえば、「堅牢な」推定器の使用、Finney&DiStefano、2008を参照)特定の基準(低レベルの歪度と尖度)。
(4) モデル制約の指定:私の意見では、SEMの使用を検討する最後の大きな理由は、モデルの特定のパスを強制(SEMの用語で「制約」)することにより、データのモデルについて持つ特定の仮説をテストすることが非常に簡単になるためです特定の値を取得し、それがモデルのデータへの適合に与える影響を調べます。(A)モデルで必要かどうかをテストするために、回帰経路をゼロに制約します。(B)大きさが等しい複数の回帰経路を含む(たとえば、ある予測因子の結合強度は不安とうつ病でほぼ等しいか)。(C)測定の不変性を評価するために必要な測定パラメーターを制限する(上記)。(D)2つの異なるグループ間で回帰経路の強度が等しくなるように制約し、
SEMのデータ関連の要件は何ですか?
SEMのデータ関連の要件はかなり控えめです。適切なサンプルサイズが必要であり、データが選択したモデル推定量の仮定を満たすために必要です(最大尤度が一般的です)。
サンプルサイズについて、万能の推奨事項を提示することは困難です。いくつかの単純なシミュレーションに基づいて、Little(2013)は、非常に単純なモデルでは100-150の観測で十分かもしれないと示唆していますが、モデルが複雑になるにつれて、および/またはモデルが減少します。モデルの複雑さが懸念される場合は、潜在変数のインジケーターを分割することを検討できますが、すべてがこのアプローチに組み込まれているわけではありません(Little、Cunningham、Shahar、&Widaman、2002)。しかし、一般的に言えば、他のすべてが同じであれば、より大きなサンプル(私自身の研究では200以上を目指しています)の方が優れています。
選択した推定量の仮定を満たすことに関しては、通常、これは評価するのが非常に簡単です(たとえば、最尤推定量の歪度と尖度値を見てください)。また、データが想定された特性から逸脱している場合でも、研究では「堅牢な」推定器(Finney&DiStefano、2008)の使用、または異なる種類のデータを想定する推定器(例えば、斜めに重み付けされた正方形)。
データ分析のためのSEMの代替手段
上で強調したSEMアプローチによって提供される利点を研究者が利用しない場合、その特定の分析のより簡単でアクセスしやすいバージョンに固執することをお勧めします(例:t -テスト、ANOVA、相関分析、回帰モデル[調停、節度、および条件付きプロセスモデルを含む])。読者はそれらに精通しているため、より簡単に理解できます。基本的にSEMを単純な分析的アプローチと同じ効果で使用している場合、読者をSEMの特徴と混同する価値はありません。
SEMの使用を検討している研究者へのアドバイス
SEMを初めて使用する場合:
- 包括的でアクセスしやすい形で作成された基礎SEMテキストを入手します。Beaujean(2014)、Brown(2015;以前の版も堅実)、Little(2013;後に縦モデルに特に焦点を当てているにもかかわらず、全体的な紹介が良い)が好きです。
- (Rosseel、2012)の
lavaan
パッケージの使用方法を学びますR
。シンタックスはSEMシンタックスと同じくらい簡単で、多くの人々のSEMニーズ(間違いなく初心者向け)に十分な機能を備えており、無料です。Beaujeanの本は、SEMとlavaan
パッケージを同時に紹介しています。
- CrossValidatedおよびStacksOverflowを定期的に参照/使用してください。SEMモデルをフィッティングすると、予期せぬ事態が発生する可能性があります。経験する可能性のある奇妙なことの多くは、すでにStacksで説明され、トラブルシューティングされています。
- Herikが指摘しているように、因果関係を示唆するモデルを指定しているからといって、SEMが横断的/非実験的研究で因果関係を確立するのに役立つという意味ではないことに注意してください。また、SEMを使用して縦断的および/または実験的設計からのデータを分析することを検討する価値があります。
そして、実際にSEMを使用し始めている人のために:
- ある時点で、モデルの適合性を改善するために、相関残差を自由に指定するようになります。しないでください。少なくとも十分な事前の理由がないわけではありません。多くの場合、より大きなサンプル、またはより単純なモデルが治療法です。
- 潜在変数の識別にマーカー変数法を使用しないでください(つまり、最初の因子負荷を1に固定します)。ほとんどの場合、これが事実であると仮定する理由はありませんが、潜在的な変数の「ゴールドスタンダード」インジケータとしてそのインジケータを特権します。これはほとんどのプログラムのデフォルトの識別設定であることに注意してください。
参照資料
ボージャン、AA(2014)。Rを使用した潜在変数モデリング:ステップバイステップガイド。ニューヨーク、NY:Routledge。
ブラウン、TA(2015)。応用研究者の確認因子分析(第2版)。ニューヨーク、ニューヨーク:ギルフォードプレス。
フィニー、SJ、およびディステファノ、C。(2008)。構造方程式モデリングの非正規およびカテゴリデータ。GRハンコック&RDミューラー(編)で、構造方程式モデリング:2番目のコース(pp。269-314)。情報化時代の出版。
ケニー、DA、キャシー、DA、およびクック、WL(2006)。二項データ分析。ニューヨーク、ニューヨーク:ギルフォードプレス。
リトル、TD(2013)。縦方向の構造方程式モデリング。ニューヨーク、ニューヨーク:ギルフォードプレス。
Little、TD、Cunningham、WA、Shahar、G。、およびWidaman、KF(2002)。小包するか、小包しないか:質問を調査し、メリットを評価します。構造方程式モデリング、9、151から173まで。
Rosseel、Y.(2012)。lavaan:構造方程式モデリング用のRパッケージ。Journal of Statistics Software、48(2)、1-36。
ヴァンデンバーグ、RJ、およびランス、CE(2000)。測定不変性に関する文献のレビューと統合:組織研究者向けの提案、実践、推奨事項。組織の研究方法、3、4-70。