平均相関係数の意義


11

免責事項:この質問が別の質問と非常に類似していると思われる場合は、統合してよかったと思います。しかし、他に満足のいく答えが見つからなかったため(コメントや賛成投票の「評判」はまだありません)、自分で新しい質問をするのが最善だと思いました。

私の質問はこれです。12人の被験者それぞれについて、独立変数Xの6つのレベル間の相関係数(スピアマンのrho)と、従属変数Yの対応する観測値を計算しました(注:Xのレベルは被験者間で等しくありません)。帰無仮説は、一般的な母集団では、この相関はゼロに等しいということです。この仮説を2つの方法でテストしました。

  1. 私の12人の被験者から得られた相関係数に1標本t検定を使用します。

  2. XのレベルとYの観測値を中央に配置し、参加者ごとに、mean(X)= 0とmean(Y)= 0を設定して、集計データ(Xの72レベルとYの観測値72)の相関を計算します。 。

ここで、相関係数の操作について(ここや他の場所で)読むことから、最初のアプローチが有効かどうか疑い始めました。特に、平均的な相関係数のt検定として(見かけ上)提示された次の方程式がいくつかの場所でポップアップするのを見ました。

t=rSEr=n21r2

ここで、は平均の相関係数(最初に被験者ごとの係数でフィッシャーの変換を使用してこれを取得したと仮定します)であり、nは観測数です。直観的には、被験者間変動の測定値が含まれていないため、これは私には間違っているようです。つまり、3つの相関係数がある場合、[0.1、0.5、0.9]、[0.45 0.5 0.55]、または同じ平均値(およびn = 3)の値の範囲にかかわらず、同じt統計が得られます。rnn=3

したがって、上の式は実際には相関係数の平均の有意性をテストするときではなく、2つの変数の観測に基づいて単一の相関係数の有意性をテストするときに当てはまるのではないかと思います。n

ここの誰かがこの直感を確認したり、なぜそれが間違っているのか説明したりできますか?また、この式が私のケースに当てはまらない場合、誰かが正しいアプローチを知っていますか?または、私のテスト番号2はすでに有効ですか?どんな助けでも大歓迎です(私が見逃したまたは誤解している可能性がある以前の回答へのポインタを含みます)。


2
ピアソンのは、センタリングとスケーリング変換の影響を受けないので、センタリングはあなたの質問には関係ないと思います。例えば、COR(X Y)= COR(X Y - ˉ Y)= COR(X Y + 1000年)= COR(X Y × 1000年)。rX,YX,YY¯X,Y+1000X,Y×1000
Alexis

仰るとおりです。そのため、私はセンタリングを「各変数を個別にセンタリングしてからまとめる」と解釈しました。
フェデリコテデスキ2017

1
@FedericoTedeschiは、どのような「一緒にそれらを置く前に、個別に各変数を中心に」ではない手段?YY¯
Alexis

@Alexis私は私の答えの下部であなたに返信しました(コメントでそれを書くには長すぎたでしょう、そしてWYSINWYG問題のために何度か修正する必要があったでしょう)。
フェデリコテデスキ2017

回答:


2

このデータを分析するためのより良いアプローチは、ランダム効果(ランダム切片またはランダム切片+スロープ)として混合(別名混合効果モデル、階層モデル)をsubject使用することです。私の別の答えを要約する

これは本質的に、単一の全体的な関係をモデル化する回帰であり、その関係はグループ(被験者)間で異なることができます。このアプローチは部分的なプーリングの恩恵を受け、データをより効率的に使用します。


-1

私は、変数(6 X6 Y)がすべての個人で同じであると仮定します(実際には、レベルが被験者間で等しくないと言って、あなたが何を言っているのか理解できません。各変数についてどの変数が測定されるかではなく、変数の範囲間の独立性について言及します。はい、表示した式は2つの変数間の相関係数に適用されます。126 X6 Y

あなたのポイント2では、正規化について話します変数ごとに個別に行うと、これは理にかなっていると思います。ただし、それでも、このアプローチの問題は、個人内の依存関係を制御できないことです。62

私はそれが間テストになるので、あなたのアプローチ1は、どちらか有効ではないと信じ配布を持つ変数トンだけで10自由度、私はあなたがこのような場合には中心極限定理を適用することができるとは思いません。6t10

多分、大きい数字では、ランダムな傾きを可能にすると同時に、(ヌル平均係数の両方を試験する、ランダム効果のアプローチを使用することができるY I及びランダム係数の非存在)。しかし、6つの変数と12の観測では十分ではないと思います。XiYi

個の変数(XYの両方)の間の相関行列の6つの値(対角線より下の値も考慮する場合は12になる)、つまり2番目の対角線(および第3象限に相当)。したがって、制限付きモデルと制限なしモデルの間で尤度比検定を行います。12XY

@Alexis私の理解では、その中心にY 1... Y 6に置き換えることにより、X * 1 = X 1 - ¯ X 1... X * 6 = X 6 - ¯ X 6Y * 1 = Y 1 - ¯ Y 1... Y *X1,,X6Y1,,Y6理にかなって(私はそれがまた自分でそれらを分割するために理にかなって考えてSEさん)。このように、変数X*Y*(考慮して作成されたX * Iを1iが6彼らはのためのユニークな変数の出現、そして同じであったかのようにY * 私は)すべてのだろう0平均を。逆に、2つの変数XYを最初に作成すると(Xを考慮して作成されます)X1=X1X1¯,,X6=X6X6¯,Y1=Y1Y1¯,,Y6=Y6Y6¯SEXYXi,1i6Yi0X,Yそれらがユニーク変数の出現、およびのための同じであるかのように Y I)は、もちろん平均値を減算し(またのSEで割るの X Yの事を変更しないであろう)。Xi,1i6YiXY

編集01/01/18

してみましょう、変数と示しJ1 J 12)個人を。次に、次のように仮定します。ij1j12

X1j=Y1j=10,j

X2j=Y2j=8,j

X3j=Y3j=6,j

X4j=Y4j=4,j

X5j=Y5j=2,j

X6j=Y6j=j,j

この場合の相関はです。0.5428

私たちは、各変数を中央にした場合、のために、与えられたことを、両方のX IYが、私は何も変化がない、我々は持っている:X * I J = Y * I 、J = 0私は= 6、我々は、値が取得X * 6 J = J - 6.5 Y * J 6 = 13 - J - 6.5 = 6.5 -1i5XiYiXij=Yij=0i=6(すなわち、用 Xさん: - 5.5 - 4.5 - 3.5 - 2.5 - 1.5 - 0.5 0.5 1.5 2.5 3.5 4.5 5.5、およびのためのまったく逆 Yさん) 。以来 0 = - 0 J - 6.5 = - 6.5 - J 、我々が得る: Xを*X6j=j6.5,Yj6=(13j)6.5=6.5jX5.5,4.5,3.5,2.5,1.5,0.5,0.5,1.5,2.5,3.5,4.5,5.5Y0=0j6.5=(6.5j)、の相関関係を意味-1Xij=Yiji,jX=Y1


cor(Xi,Yi)=cor(Xi,Yi),icor(X,Y)=cor(X,Y)一般的には真実ではありません。反例を示すために投稿を編集しています。
フェデリコテデスキ

0.5428X=10,10,10,10,10,10,10,10,10,10,10,10,8,8,8,8,8,8,8,8,8,8,8,8,6,6,6,6,6,6,6,6,6,6,6,6,4,4,4,4,4,4,4,4,4,4,4,4,2,2,2,2,2,2,2,2,2,2,2,2,1,2,3,4,5,6,7,8,9,10,11,12Y=10,10,10,10,10,10,10,10,10,10,10,8,8,8,8,8,8,8,8,8,8,8,8,6,6,6,6,6,6,6,6,6,6,6,6,4,4,4,4,4,4,4,4,4,4,4,4,2,2,2,2,2,2,2,2,2,2,2,2,12,11,10,9,8,7,6,5,4,3,2,10.54281

X=0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,5.5,4.5,3.5,2.5,1.5,0.5,0.5,1.5,2.5,3.5,4.5,5.5X=0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,5.5,4.5,3.5,2.5,1.5,0.5,0.5,1.5,2.5,3.5,4.5,5.51X=1,,12Y=12,,1cor(X,Y)=cor(X,Y)=1cor(Xi,Yi)=cor(Xi,Yi)

cor(X;Y)=cor(XX¯;YY¯)

XX¯X1X¯,X2X¯,,XnX¯
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.