相関の非推移性:性別と脳の大きさの間、および脳の大きさとIQの間の相関関係、性別とIQの間の相関関係はない


18

ブログで次の説明を見つけましたが、相関関係の非推移性に関する詳細情報を取得したいと思います。

次の議論の余地のない事実があります。

  • 平均して、男性と女性の間で脳容積に違いがあります
  • IQと脳の大きさの間には相関関係があります。相関は0.33であるため、IQの変動の10%に相当します

これらの前提1と2から、論理的には次のように思われる:平均して女性は男性よりも低いIQを持っている。しかし、それは誤りです!統計では、相関関係は推移的ではありません。証拠は、IQテストの結果を見るだけでよく、男性と女性のIQが平均して変わらないことを示しています。

この相関関係の非推移性をもう少し深く理解したいと思います。

IQと脳の大きさの相関関係が0.9だった場合(これは(1)ではないことを知っています)、男性よりも平均して女性のIQが低いと推測することはまだ誤解でしょうか?

どうか、IQ(およびテストの限界)、性差別、女性のステレオタイプ、慢などについて話をするためにここにいるのではありません(2)。誤justの背後にある論理的な理由を理解したいだけです。


(1)ネアンデルタール人の頭脳はホモサピエンスよりも大きかったが、賢くはなかった。

(2)私は女性であり、全体として、自分自身や他の女性の方が男性よりも賢くないと考えています。IQテストは気にしません。知的能力。


フランス語の元のソース

les faits indiscutables suivantsについて:

  • il ya unedifférencede volumecérébralen moyenne entre hommes et femmes
  • QIとボリューム・セレブラル全体の相関関係。相関係数0.33以下、10%の変動係数に対応

1回目と2回目はsembledécoulerlogiquement que:les femmes ont en moyenne un QIinférieuraux hommes。

Mais c'est une erreur de raisonnement!統計上、相関関係は一時的なものではありません。La preuve、c'est que pour en avoir lecœurnet、il suffit de relever les reresults des tests de QI、et ce-ci-ci montrent que les QI des hommes et des femmes nediffèrentpas en moyenne。

ここに画像の説明を入力してください


5
私はこれらのステートメントが相関関係とどう関係するのか全く理解していません(そして、この文脈では「推移性」への言及は完全に不適切と思われます)。結論は、結局のところ、平均差に関係しています。その統計(最初の瞬間)は、相関(これは2番目の瞬間から導出されます)から完全に独立しています。相関が完全なであっても、最初の変数の平均の差に基づいて2番目の変数の平均の差について結論を出すことはできません。±1
whuber

5
2乗相関の合計が1より大きい場合、正の相関は推移的であることを示すことができます(Langford、Schwertman、およびOwens(2001))。ρXY2+ρYX2>1ρXZ>0
CloseToC

2
@whuber:はい。ただし、これはXとYの平均(脳の大きさとIQ)の関係についての質問ではなく、2つの異なるクラスターのYの平均の関係についての質問です。脳のサイズとIQの相関が完全な場合(つまり、IQは脳のサイズの線形関数)、平均脳サイズが男性と女性で異なる場合、平均IQは男性と女性で異なります。
アメーバは、モニカを復活させる

2
@Amoebaその解釈をありがとう。引用は意味を成し始めます(最終的に!)。しかし、これを「相関の推移性」と呼ぶのは、率直に誤解を招くほど曖昧です。(フレーズは元のフランス語にあるため、翻訳を非難することさえできません。)
whuber

3
@amoebaそれはもっともらしい。しかし、私はあなたがそこに到着するために物事をかなりストレッチしなければならないと思います!この引用は、性別と脳の大きさの関係を「相関」として特徴付けているのではなく、2つのグループ間の平均の違いとしてのみ(これは標準的な相関の尺度ではありません)しかし、広い意味で「相関関係」を「依存性の欠如」またはそのようなものとして理解することになっていると思います。
whuber

回答:


16

はい、それはまだ間違いです。

これは、4つの異なる状況を示す非常に単純な図です。それぞれの場合で、赤い点は女性を表し、青い点は男性を表し、横軸は脳の大きさを表し、縦軸はIQを表します。次のような4つのデータセットをすべて生成しました。

  • 男性()と女性(単位は任意)の平均脳サイズには常に同じ違いがあります。これらは母集団の平均ですが、この差は十分な大きさであり、妥当なサンプルサイズで統計的に有意です。282228

  • 男性と女性の間で平均IQの差は常にゼロ(両方とも)であり、性別とIQの間の相関もゼロです。100

  • 脳の大きさとIQの相関の強さは、図に示すように異なります。

相関関係

左上のサブプロットの性別内相関(男性と女性で別々に計算され、平均された)は、引用のようにです。右上のサブプロットでは、全体的な相関関係(男性と女性を合わせた)はです。引用では、の数値が何を指すかを指定していないことに注意してください。左下のサブプロットでは、仮定の例のように、性別内相関はです。右下のサブプロットでは、全体的な相関はです。0.3 0.33 0.9 0.90.30.30.330.90.9

したがって、任意の相関値を使用でき、全体またはグループ内で計算されるかどうかは関係ありません。相関係数がどうであれ、性別とIQの間の相関がゼロであり、平均IQの性差がゼロである可能性は十分にあります。


非推移性を探る

@kjetilによって提案されたアプローチに従って、可能性の全領域を探ってみましょう。3つの変数があるとしますおよび(一般性を失うことなく) x 1 x 2の相関が a > 0であり、 x 2 x 3の相関が b > 0であると仮定します。問題は、 x 1 x 3の間の相関 λの可能な最小の正の値は何ですか?それは時々ん持ってポジティブであることを、またはそれは常にゼロになることができますか?x1,x2,x3x1x2a>0x2x3b>0λx1x3

相関行列は、それはすなわち、非負行列式を有していなければならないD 、E 、T R = - λ 2 + 2 Bのλ - 2 + B 2 - 1 0 つまりλが間に存在しなければならないB ±

R=(1aλa1bλb1)
detR=λ2+2abλ(a2+b21)0,
λ両方の根が正であれば、最小限の可能な値λが小さいルートに等しい(及びλは正でなければなら!)。これら2つのルートの間にゼロがある場合、λはゼロになることがあります。
ab±(1a2)(1b2).
λλλ

これを数値的に解き、異なるabについて、可能な限り小さい正の値をプロットできます。λab

非推移性の探索

a>0b>0λ>0abλabλ ab 高くなければなりません。

ab(1a2)(1b2)>0a2+b2>1

あなたの特定の例では、性別と脳の大きさの相関は非常に穏やかで(おそらく)、脳の大きさとIQの相関はb = 0.33で、これは青い領域(a 2 + b 2 < 1)内にしっかりと入っていますλは、正、負、またはゼロです。a=0.5b=0.33a2+b2<1λ


元の研究からの関連図

あなたは性別と脳について議論することを避けたかったのですが、元の記事(Gur et al。1999)から完全な数字を見ると、言葉のIQスコアに性差はありませんが、空間IQスコアの明らかで有意な違い!サブプロットDとFを比較します。

Gur等。


2
あなたが生成したプロットが大好きです。紙からのもの、それほどではない
...-シャドウトーカー

1
@AleksandrBlekh:実を言うと、わかりません。「ヒートマップ」?「等高線図」が色付きで等高線なし?
アメーバは、モニカを復活させる

2
|λ|λ

1
xyyzxzab0λ0

1
この長く詳細な回答をありがとうございます(さらに追加されたので、とても歓迎します)!それは物事を明確にします!この概念は、統計的に訓練されていない私の脳をつかむのが非常に難しく、問題に光を当てました!回答の投稿に時間を割いていただき、ありがとうございます!
MagTun

8

x1=IQ,x2=genderx3

cor(x1,x2)=λ,cor(x1,x3)=cor(x2,x3)=ρ=0.9
λ
R=(1λρλ1ρρρ1)
ρ
detR=1(1ρ2)λ(λρ2)+ρ(λρρ)=1λ22ρ2+2λρ20,
ρ2λ+12ρ=0.9λ0.62

更新:

コメントに応じて、上記の回答をいくらか更新しました。さて、これで何ができますか?上記の計算によると、IQと脳の体積の間の0.9の相関(経験的よりもはるかに大きい)。次に、性別とIQの相関は少なくとも0.62でなければなりません。どういう意味ですか?コメントでは、これは性別の平均差については何も意味しないと言う人もいます。しかし、それは真実ではありません!はい、正規分布変数については、関係のない相関と平均を割り当てることができます。しかし、性別がゼロ1変数である、そのような変数のためにそこにある相関と平均差の関係は。具体的には、IQは(たとえば)正規分布しますが、性別はゼロ対1になります。平均と仮定しましょうp=0.5μ1=E(x1|x2=1)μ0=E(x1|x2=0)μ=E(x1)μ=0=μ1+μ0μ0=μ1x1N(μ=0,σ2)x2p=1/2

corr(x1,x2)=E(x1μ)E(x2p)σ12=Δ2σ
Δ=μ1μ0=2μ1σ=10Δ/20IQの平均差に関する情報が間違っています!性別が連続変数である場合、それは当てはまりますが、明らかにそうではありません。この事実は、二項分布の場合、分散は平均の関数であるという事実に関連していることに注意してください(変動する自由パラメーターは1つしかないため、そうでなければなりません)。上記で行ったことは、実際にこれを共分散/相関に拡張することです。

ρ=0.33λ0.7822λ=0


1
cor(x1,x2)0.62E(x1)E(x2)

5
+1-しかし、男性と女性のIQの相関関係の概念は、このような値を計算することはできなかったため、やや紛らわしいと思います。
アンディW

1
男性と女性のIQの相関関係はどういう意味ですか?!
アメーバは、モニカーを復活させる

はい、そうです@amoeba!混乱を表現するために正しい単語を使用しなかったかもしれませんが(統計に慣れていないため困難です)、変数は確かに性別、IQ、脳の大きさです。
MagTun

7

これは、パス図を使用して直接的な効果と間接的な効果、およびこれら2つが全体的な相関にどのように影響するかを示すのが好きな状況です。

元の説明によると、以下の相関行列があります。脳の大きさはIQと約0.3の相関関係があり、女性とIQは相互に0の相関関係があります。女性と脳の大きさの間の負の相関関係を-0.3に設定します(それよりもはるかに小さいと推測する必要がある場合、これは説明のために役立ちます)。

       Brain  Female  IQ
 Brain   1
Female  -0.3    1
    IQ   0.3    0      1

IQが脳の大きさと女性の関数である回帰モデルを当てはめると、これをパス図で説明できます。矢印の偏回帰係数を入力しました。Bノードは脳の大きさを表し、Fノードは女性を表します。

ここに画像の説明を入力してください

脳の大きさを制御するとき、これらの相関関係を考えると、女性はIQと正の関係にあります。周辺相関がゼロのとき、これはなぜですか?線形パス図を使用したルール(Wright、1934)に従って、脳のサイズと間接効果を制御する際に、直接効果の関数として周辺相関を分解できます。

TotalF,IQ=DirectF,IQ+IndirectF,B,IQ

TotalF,IQ=Cor(F,IQ)

IndirectF,B,IQ=Cor(F,B)Cor(B,IQ|F)0.099=0.30.33

合計効果はゼロであるため、直接効果は単純に間接効果の正反対の符号とサイズでなければならないことがわかっているため、この例では直接効果は0.099に等しくなります。さて、ここで、女性の予想されるIQを評価するときに2つの異なる答えが得られる状況がありますが、おそらく質問を指定するときに最初に期待したものではありません。女性と男性の限界予想IQを単純に評価するとき、定義したように(ゼロ相関を持つことにより)差はゼロです。脳の大きさを条件とする予想される差を評価する場合、女性は男性よりも大きなIQを持っています。

この例では、kjetilが答えで示した制限を考慮して、脳のサイズとIQのより大きな相関(または女性と脳のサイズのより小さな相関)を挿入できます。前者を増やすと、女性と男性の条件付きIQの格差がさらに大きくなり、後者を減らすと差が小さくなります。


提供されている写真を見ると、女性の脳容積とIQの正の相関(男性より強い相関)が示されています。
アレコスパパドプロス

1
@Andy Wこの馬鹿げた質問をするのは恥ずかしいが、ノードグラフを描くのにどのソフトウェアを使用したのか?
ムゲン

1
inkscape @mugenでは簡単な仕事でした。もっと時間がかかると、LatexとTikzを使って作ったほうがいいと思います。
アンディW

+1 2番目の式の背後にある理論を教えてください。
アレクサンドルブレフ

2
@AleksandrBlekh-私が引用したWright紙は独創的な情報源です。Judea Pearlは、彼の因果関係の本で、より単純な扱いはありますが、より広範な解説をしています。(線形モデルの場合、構造方程式モデリングの本では、分解に大雑把な処理が行われることがよくあります。)
Andy W

3

vq12

(1)E(v1)>E(v2)=βE(v1),0<β<1,ρ(v1,q1)>0,ρ(v2,q2)>0

引用されたテキストは一般に「脳容積とIQの相関」について述べていますが、提供された画像は2つの傾向線で区別しています(つまり、2つのサブグループの相関を別々に示しています)。したがって、それらを個別に検討します(これが正しい方法です)。

それから

ρ(v1,q1)>0Cov(v1,q1)>0E(v1q1)>E(v1)E(q1)

(2)E(v1q1)E(q1)>E(v1)

そして

ρ(v2,q2)>0Cov(v2,q2)>0E(v2q2)>E(v2)E(q2)

(3)E(v2q2)βE(q2)>E(v1)

E(q1)>E(q2)

(4)E(q1)=E(q2)=q¯

その後、それはそうでなければなりません

(5)(2),(4)E(v1q1)q¯>E(v1)

そしてそれ

(6)(3),(4)E(v2q2)βq¯>E(v1)

(5)(6)
(1)

(1)E(q1)E(q2)(1)


2
ここに示したすべての計算にも関わらず、平均値間の関係に関して、相関がどのように明らかになるのか(または制約を課す)かはまだわかりません。
whuber

@whuber全体の答えは、そうではないことを示すことです。最後の文はまさにそれを言っています。その効果にもう1つ追加しましょう。
アレコスパパドプロス

しかし、これは絶対に基本的なものです。それを示すために方程式のページ全体を必要としないのです!相関係数が位置不変、QEDであることを観察すれば十分です。質問を誤って解釈していますか?
whuber

1
@whuberすべての正当な敬意と誰にも意味のある犯罪はありませんが、私はあなたがOPの知識レベルを「誤解している」ことを恐れています。そうでなければ、質問は投稿されませんでした。
アレコスパパドプロ

4
数学の方程式に大きく依存する回答が、基本概念の初歩的な説明を求めているように見えるポスターに対処するのに適切であるかどうか、そしてどのように考えるかをお勧めします。これは微妙な問題です。なぜなら、それが正確に正しいアプローチになる場合があるからです。さらに、数学を使用する度合い、および数学的なアイデアをどのように説明するかは、好みの問題になる可能性があります。しかし、私見このような回答は、数学が明確であり、本質的なアイデアに一貫して焦点を合わせている場合にのみ有効です。
whuber
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.