相関値の平均化


20

さまざまな実験条件下Yで変数が変数にどのように依存するかをテストしX、次のグラフを取得するとします。

ここに画像の説明を入力してください

上記のグラフの破線は、各データ系列の線形回帰を示し(実験設定)、凡例の数字は各データ系列のピアソン相関を示します。

私は間を「平均相関」(または「平均相関を」)を計算したいXYr値を単純に平均してもいいですか?「平均判定基準」どうですか?平均を計算し、その値の2乗を取るか、個々のR 2の平均を計算する必要がありますか?R2rR2

回答:


15

簡単な方法は、カテゴリ変数を追加して異なる実験条件を識別し、それをxとの「相互作用」とともにモデルに含めることです。つまり、Y Z + X Z。これにより、5つの回帰すべてが一度に実行されます。そのR 2はあなたが望むものです。zxyz+x#zR2

個々の値の平均化が間違っている理由を確認するために、実験条件の一部で勾配の方向が逆になっていると仮定します。1と-1の束を平均して約0にしますが、これはフィットの品質を反映しません。R 2(またはその固定変換)の平均化が正しくない理由を確認するために、ほとんどの実験条件で観測値が2つだけで、R 2がすべて1であると仮定しますが、1つの実験ではR 2 = 0。ほぼ1 の平均R 2は、状況を正しく反映しません。RR2R21R2=0R2


1
私の無知を許しますが、あなたの答えの#サインは何を意味しますか?
ボリスゴリリック

1
あなたの答えは、使用される相関の暗黙の定義にとって非常に良いものだと思います。彼らがそれを意味する標準化された勾配として意味する場合はどうでしょうか(おそらく図によって暗示されています)?その場合、ネガティブとポジティブをキャンセルする必要があります。あなたはサンプルサイズの問題について死んでいます。また、コメントを回答に移動することを検討してください。
ジョン

あなたがしたいですかまたは調整R 2をR2R2
russellpierce

±1R21

R2R21

24

ピアソン相関係数の場合、一般的にフィッシャーz変換を使用してr値を変換することが適切です。次に、z値を平均し、その平均値をr値に変換します。

スピアマン係数についても同様にうまくいくと思います。

ここだやWikipediaのエントリが


1
+1; この回答は、受け入れられた回答よりも適切で一般的と思われますが、特定のユースケースでは、rの値が1の場合、バラバラになりませんか?ここでは、相関のないデータポイントを「追加」するだけの、皇帝のロジットのようなものは妥当ですか?もしそうなら、どこに追加しますか?ソース分布から2つのランダム変数を取得するモンテカルロシムを実行する必要がありますか?あるいは、rを1よりわずかに小さい値に調整するだけでしょうか?どのくらい調整する必要がありますか?
ラッセルピアス

3

平均相関は意味があります。相関の分布も考慮します(たとえば、ヒストグラムをプロットします)。

n

m


1

アルゴリズムのパフォーマンスに平均二乗予測誤差(MSPE)を使用するのはどうですか?アルゴリズムのセット間で予測パフォーマンスを比較しようとする場合、これはあなたがしようとしていることに対する標準的なアプローチです。


この投稿stats.stackexchange.com/questions/17129/…がなぜこの投稿とマージされたのかはわかりません。彼らは実際に私の意見で2つの異なる質問をしています-2つの異なる目標があります。
StatsStudent

1
あなたは正しいです:それらは異なる質問です。私は他の投稿を再び開くことに投票しました(ただし、どのような効果があるかは不明です)。コメントが表示されないことをおIび申し上げます。代わりにその投稿にフラグ立てていた場合、数年前に私たちの注目を集めていたはずです。
whuber
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.