変数のグループ間/内で相関を計算する方法は?


13

1000個の観測値と50個の変数のマトリックスがあり、それぞれが5ポイントスケールで測定されています。これらの変数はグループに編成されていますが、各グループには同数の変数はありません。

2種類の相関を計算したい:

  1. (特性間の)変数グループ内の相関:変数グループ内の変数が同じものを測定しているかどうかの尺度。
  2. 変数のグループ間の相関:各グループが1つの全体的な特性を反映していると仮定して、各特性(グループ)が他のすべての特性とどのように関連しているかを示す何らかの尺度。

これらの特性は、以前グループに分類されていました。グループ間の相関関係を見つけることに興味があります。つまり、グループ内の特性が同じ基本特性(上記の#1を完了した-クロンバッハのアルファ)を​​測定していると仮定すると、特性自体は関連していますか?

誰がどこから始めればいいのか提案はありますか?


1
Rに精通している場合は、vegan機能anosimまたはできればadonis(permutational MANOVA)のパッケージがあります。
ローマンルシュトリック

標準用語(つまり、特性ではなく変数、「グループ」ではなく変数のグループ)を使用しようとする質問を更新しました
Jeromy Anglim

回答:


16

@rolandoが提案したことは、全体の応答(IMO)ではないにしても、良いスタートのように見えます。古典的テスト理論(CTT)フレームワークに従って、相関アプローチを続けます。ここで、@ Jeromyで述べたように、特性グループのサマリーメジャーは、これからスケールと呼ぶものに属するすべてのアイテム(単語の特性)の合計(または合計)スコアと見なすことができます。CTTでは、これにより、個々の「特性」傾向または負債を、基礎となる構造(潜在特性)を反映する連続的なスケールでの位置として形式化することができます。 。

あなたが説明したことは、心理測定における収束性(同じスケールに属するアイテムが相互にどの程度相関するか)および判別的(異なるスケールに属するアイテムはそれほど相関すべきではない)の有効性と関係しています。古典的な手法には、マルチ特性マルチメソッド(MTMM)分析(Campbell&Fiske、1959)が含まれます。それがどのように機能するかの実例を以下に示します(3つのメソッドまたはインストゥルメント、3つのコンストラクトまたはトレイト):

ここに画像の説明を入力してください

>0.7<.3

この方法が最初に開発されたのは、さまざまな測定機器で研究された特定の数の特性の収束的および判別的有効性を評価する場合でも、単一のマルチスケール機器に適用できます。特性はアイテムになり、メソッドは異なるスケールになります。この方法を単一の機器に一般化したものは、マルチトレイトスケーリングとも呼ばれます。期待どおりに相関する(つまり、異なるスケールではなく、独自のスケールを持つ)アイテムは、スケーリングの成功としてカウントされます。ただし、一般的に、異なるスケールは相関していない、つまり、異なる仮想構造をターゲットにしていると想定しています。ただし、スケール内およびスケール間の相関を平均すると、機器の内部構造を簡単に要約できます。別の便利な方法は、ペアワイズ相関のマトリックスにクラスター分析を適用し、変数がどのように連携するかを確認することです。

注目すべき点は、どちらの場合でも、相関測定を行う際の通常の注意事項が適用されます。つまり、測定誤差を考慮することができず、大きなサンプルが必要であり、機器またはテストが「平行」であると想定されることです(タウ等価、非相関誤差、等しい誤差分散)。

@rolandoが扱う2番目の部分も興味深いものです。すでに確立されたアイテムのグループ化が理にかなっているという理論的または実質的な兆候がない場合は、探索的因子分析などでデータの構造を強調する方法を見つける必要があります。しかし、これらの「グループ内の特性」を信頼していても、これが有効な仮定であることを確認できます。ここで、確認因子分析モデルを使用して、アイテムのロードのパターン(アイテムと独自のスケールの相関)が期待どおりに動作することを確認している場合があります。

従来の因子分析法の代わりに、アイテムのクラスタリング(Revelle、1979)を見ることができます。これは、アイテムを均一なスケールにグループ化するために、Cronbachのアルファベースの分割ルールに依存しています。

最後の言葉:Rを使用している場合、前述の手順を簡単にする2つの非常に素晴らしいパッケージがあります。

  • サイケ、あなたがpsychometrics因子分析を含む方法、(を使い始めるために必要なすべてを提供しますfafa.parallelprincipal)、アイテムクラスタリング(ICLUSTおよび関連する方法)、クロンバックのα係数(alpha); William RevelleのWebサイトには、特にRでのアプリケーションを使用した心理測定理論の概要に関する概要があります。
  • psyには、スクリープロット(PCA +シミュレートされたデータセットによる)視覚化(scree.plot)およびMTMM(mtmm)も含まれます。

参照資料

  1. キャンベル、DTおよびフィスケ、DW(1959)。multitrait-multimethodマトリックスによる収束的かつ判別的な検証。Psychological Bulletin、56:81–105。
  2. Hays、RD and Fayers、P.(2005)。複数アイテムのスケールの評価。臨床試験での生活の質を評価する、(Fayers、P.およびヘイズ、R.、編)、頁41-53。オックスフォード。
  3. Revelle、W。(1979)。階層的クラスター分析とテストの内部構造。多変量行動研究、14:57-74。

これは、おそらく、私が取引所で読んだ中で最も興味深い回答であり、5年間計量経済学を研究してきました。
d8aninja

ここに含まれるMTMMマトリックスは、相関マトリックスの現実的な例であると想定されていますか?その場合、実際には正の半正定行列ではないことに注意してください。たとえば、メソッド1,2にわたる特性1,2の相関関係の4行4列のマイナーには、-0.0419179の行列式があります。(これは小さな負の値なので、これは単に「測定エラー」という点に単純になります。)
半古典的

7

用語の読み方は、まず各変数グループ内の内部整合性を評価し、次に各変数グループの平均を構成するスケールスコア間の相関を評価することです。前者はクロンバッハのアルファを使用して実行でき、後者はピアソン相関を使用して実行できます。これは、合理的な正規分布と合理的な線形関係があることを前提としています。

より複雑な方法は、必ずしも必要な方法ではありませんが、探索的因子分析を実施することです。どの変数をグループ化するかを確立し、次にそれらの要因をどの程度相関させるかを確立しようとします。この方法を試す場合は、斜め回転を使用してそれらの相関関係が現れるようにしてください。主成分抽出を使用するか、主軸抽出を使用するかは、変数が客観的でエラーのない測定であるか、一定量のエラーを含む調査項目などの主観的な測定であるかによってそれぞれ異なります。


お返事をありがとうございます。クロンバックのアルファを計算することができましたが、この場合のピアソン相関係数の計算方法は?個々の特性ごとにペアワイズ方式で計算できますが、特性グループ間の相関を計算する方法を知りたいです。グループ内の特性は、各観測に対して同様のスコアを持ちます。これを少し明確にするために質問を編集します。
-18:

5
  • 少なくとも心理学におけるあなたの状況の標準ツールは、要素間相関行列と、要素と項目間の関係のいくつかの提案モデルとの収束を評価するための探索的および確認的因子分析です。質問の言い回しは、この文献に精通していない可能性があることを示唆しています。たとえば、ここに私のノートは上にある規模の建設や要因分析とここにあるクイック-R形因子分析上のRでのチュートリアル。したがって、特定の質問に答える価値はありますが、多項目、多要素の尺度を評価するための因子分析アプローチを検討することで、より広い目標を達成できると思います。

  • 別の標準的な戦略は、変数の各グループの合計スコア(「スケール」と呼ぶ)を計算し、スケールを相関させることです。

  • 多くの信頼性分析ツールは、アイテム間の平均相関を報告します。

  • アイテム間の相関関係の50 x 50マトリックスを作成した場合、変数のグループの組み合わせに基づいてサブセットを平均化する関数をRで作成できます。正の項目と負の項目が混在していると、負の相関が正の相関を打ち消す可能性があるため、必要なものが得られない場合があります。


2

ペアの場合にのみ定義される相関の概念の代替として、相互情報の概念とガウスモデルの統合を使用することをお勧めします。

G1

1log|C1|

C1G1G1log1ρ2ρ

変数の2つのグループ間の相互作用を計算するには、相互情報を使用できます。これは、グループ間のクロスエントロピーです。

Mうん12=1212

役に立つグーグルの後、これらの概念に関するリファレンスを見つけまし

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.