「思考、高速、低速」の平均への回帰


14

思考、高速と低速、ダニエル・カーネマンは、以下の仮定の質問を提起します:

(P. 186)現在、ジュリーは州立大学の先輩です。彼女は4歳のときに流readに読んだ。彼女の成績平均点(GPA)とは何ですか?

彼の意図は、特定の統計について予測する際に、平均値への回帰を説明できないことが多いことを説明することです。その後の議論では、彼は次のようにアドバイスしています。

(P. 190)2つの測定値(現在の例では読書年齢とGPA)の間の相関関係は、それらの決定要因間の共有因子の割合に等しいことを思い出してください。その割合についてのあなたの最も良い推測は何ですか?私の最も楽観的な推測は約30%です。この推定を仮定すると、偏りのない予測を作成するために必要なものはすべて揃っています。4つの簡単な手順でそこに到達する方法の手順を次に示します。

  1. 平均GPAの推定から始めます。
  2. 証拠の印象に合ったGPAを決定します。
  3. 読書早熟度とGPAの相関を推定します。
  4. 相関が.30の場合、平均から一致するGPAまでの距離の30%を移動します。

彼のアドバイスの私の解釈は次のとおりです。

  1. 「彼女は4歳のときに流readに読んだ」を使用して、ジュリーの読書の早熟度の標準スコアを確立します。
  2. 対応する標準スコアを持つGPAを決定します。(予測する合理的なGPAは、GPAと早熟度の相関が完全であれば、この標準スコアに対応します。)
  3. 読書の早熟度の変動によって説明できるGPAの変動の割合を推定します。(私は彼がこの文脈で「相関」と決定係数を参照していると思いますか?)
  4. ジュリーの読書早熟の標準スコアの30%だけが、彼女のGPAの標準スコアを説明できる要因によって説明できるため、ジュリーのGPAの標準スコアがそれの30%になると予測するだけで正当化されます。完全な相関の場合。

カーネマンの手順の私の解釈は正しいですか?もしそうなら、彼の手順、特にステップ4のより正式な数学的正当化はありますか?一般に、2つの変数間の相関関係と標準スコアの変化/差異との関係は何ですか?

回答:


2

カーネマンの手順の私の解釈は正しいですか?

カーネマンのステップ#2は非常に正確に定式化されていないため、これは少し言いにくいです:「証拠の印象に一致するGPAを決定する」-それはどういう意味ですか?誰かの印象が適切に調整されていれば、平均に向かって修正する必要はありません。誰かの印象がひどくずれている場合、彼らはむしろより強く修正する必要があります。

だから私は、カーネマンのアドバイスは経験則に過ぎないという@AndyWに同意します。

それはあなたの解釈ステップ## 1--2でそれを解釈して、あなたがカーネマンのステップ#2を解釈するならば、言った:つまり、あなたが同じでGPAを取ることとして-scoreの印象に合致する」と早熟を読み取る-score証拠」を使用する場合、手順は数学的に正確であり、経験則ではありません。zz

[...]彼の手順、特にステップ4のより正式な数学的正当化はありますか?一般に、2つの変数間の相関関係と標準スコアの変化/差異との関係は何ですか?

からを予測し、両方がスコアに変換される場合、つまり平均と単位分散がゼロで、相互に相関がある場合、回帰方程式はなることが簡単に示されますつまり、回帰係数は相関係数と等しくなります。yバツzρ

y=ρバツ

ここからすぐに、の値を知っている場合(たとえば、読みの早熟度の標準スコアを知っている場合)、の予測値(GPAの標準スコア)は倍になります。バツyρ

これはまさに「平均への回帰」と呼ばれるものです。ウィキペディアの議論いくつかの公式と派生を見ることができます。


8

番号の順序は、カーネマンの引用と一致しません。このため、全体的なポイントを見逃しているようです。

カーネマンのポイント1は最も重要です。これは、すべての人にとって、平均GPAを文字通り推定することを意味しています。このアドバイスの背後にあるポイントは、それがあなたのアンカーであるということです。予測は、このアンカーポイント周辺の変更を参考にしてください。私はあなたのポイントのいずれかでこのステップを見るかどうかわかりません!

カーネマンは頭字語のWYSIATIを使用しています。これは、現在利用可能な情報の重要性を過大評価する人間の傾向です。多くの人にとって、読解力に関する情報はジュリーが賢いと思うようにするので、人々は賢い人のGPAを推測するでしょう。

しかし、4歳の子どもの行動には、大人の行動に関連する情報がほとんど含まれていません。おそらく、予測を行う際にそれを無視する方が良いでしょう。アンカーから少しだけ揺れるはずです。また、スマートな人のGPAを最初に推測する人は、非常に不正確な場合があります。選択により、大学の高齢者の大半は平均以上の知能を持っています。

質問には、実際には4歳のときのジュリーの読解力以外の隠された情報がいくつかあります。

  • ジュリーは女性の名前である可能性が高い
  • 彼女は州立大学に通っています
  • 彼女は先輩です

これら3つの特徴すべてが、生徒全体の人口に比べて平均GPAをわずかに上昇させると思います。たとえば、GPAが非常に悪い生徒はドロップアウトするため、シニアの方がSophmoresよりも高いGPAを持っていると思われます。

したがって、カーネマンの手順は(仮説として)このようになります。

  1. 州立大学の女性シニアの平均GPAは3.1です。
  2. ジュリーの4時の高度な読解力に基づいて、彼女のGPAは3.8
  3. 4歳の読解力はGPAと0.3の相関があると思います
  4. それから3.1と3.8の間の道の30%は3.3です(すなわち3.1 + (3.8-3.1)*0.3

したがって、この仮説では、ジュリーのGPAの最終的な推測は3.3です。

カーネマンのアプローチにおける平均値への回帰は、ステップ2が利用可能な情報の重要性を大きく過大評価する可能性が高いということです。したがって、より良い戦略は、予測を全体平均に回帰させることです。ステップ3と4は、回帰する量を推定する(アドホック)方法です。


私は手順の背後にある直感を理解していますが、数学的正当化は理解していません。私の解釈では、平均GPAを推定するポイントは、標準スコアに関して特定のGPAを推定できるようにすることです。そうでなければ、読書早熟と有意義に比較することができませんでした。(
続き

1
Kahnemanは、ほとんどの人がGPA = 3.7または3.8を推測すると述べています。これはおそらく、Julieの読書の早生に関連する標準スコアに対応していますが、2つの変数間の相関は完全であると暗黙的に仮定しています。私は主に、ステップ4が直観に基づいた経験則であるか、実際の統計的に有効な手順であるかについて混乱しています(つまり、標準スコアを加算的に処理し、相関に基づいてそれらの割合を取ることができますか?)。それが単なる素人の経験則である場合、より統計的に厳密な近似方法が存在しますか?
配給

「追加的に」とは、(1)ジュリーの標準スコアGPAのある割合が読書の早さを説明できる要因によって説明されていること、(2)彼女の標準スコアGPAの残りの割合が要因によって説明されていること、 (3)合計されたこれらの貢献はジュリーに対して予測する最終標準スコアGPAと等しく、(4)偏った予測の割合を取るだけで予測を修正できること このような標準偏差の割合での作業は、たとえば平方根での作業とは対照的に有効ですか?
配給

これはアドホックルールです。ステップ2と3は、必ずしも論理的に一貫しているとは限りません。(同じ情報を言う2つの異なる方法があります。1つはエフェクトサイズであり、もう1つは標準化されたエフェクトサイズです。)
Andy W
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.