前の研究者は、単に統計上の誤りのためにホットハンドを検出できませんでしたか?


11

多くのバスケットボールファン/プレーヤーは、連続していくつかのショットを行った場合、次のショットが入る可能性が高いと考えています。これはホットハンドと呼ばれることもあります。

Gilovich、Mallone、Tversky(1985)から(私が思うに)、これは実際には誤fallであることが「示された」。連続して複数のショットが入ったとしても、次のショットは、平均的な撮影の割合が指示するよりも入る可能性は高くありません。

Miller and Sanjurjo(2015)は、ホットハンドは実際に存在し、以前の研究者はかなり基本的な統計的誤acyの餌食になったと主張しています。彼らの議論は次のようなものです。

コインを4回裏返します。HがHに続く確率を計算します。いくつかの例を挙げると、HHTTは確率1 /2、HTHTは確率0/2、TTHHは確率0/1 1 / 1、TTTTとTTTHはともにNAです。

MillerとSanjurjoのパンチラインは、この確率の期待値が0.5ではなく、0.4であることです。そして、以前の研究者が犯したエラーは、この確率の期待値が0.5であると誤って仮定することでした。たとえば、これらの以前の研究者が上記のコインフリッピング実験を実施し、平均確率が0.497であるとわかった場合、実際にはホットハンド(0.5と有意な差はない)の証拠はないと結論付けました。ホットハンドの強力な証拠(0.4とは大きく異なる)。

私の質問はこれです。ミラーとサンジュルホは、以前の研究者がこのミスのためにホットハンドを検出できなかったのは正しいのですか?私はこれについて1、2枚の論文を読み飛ばしただけなので、この文献をよりよく知っているだろう誰かから確認を求めていました。これは、30年以上続いた驚くほど愚かなエラーのようです。


3
これは、特に部外者にとって、評価が非常に難しいという意味で、このサイトにとって危険な質問です。そしてそれが、多数決によるベストアンサーの「決定」方法です。必ずすべての回答を読んで、すべての回答を読んだ後に正しいと思われるもののみを賛成票で投票し、不満/疑わしいと思われるものは反対票で投票してください。
FooBar

1
これは、正しい答えが直感に反する可能性があるためです。このようなサイトが60年前に存在した場合、モンティホールの問題(同様の特性を持っている)に対する正しい答えが多数決によってトップになるとは思いません。
FooBar

@FooBar、あなたのポイントに追加するために、2つの複雑な質問がここで同時に進行しています:(1)「ミラーとサンジュロが議論する数学的効果は何ですか」---これはケニーLJが尋ねた質問ではなく、理解するには多くの読書を必要とし、比較的客観的であるため、良い質問です。次に、(2)は「これは以前の研究を無効にしますか」であり、主観的で意見に基づくようです...
usul

@usul:経済学のいくつかのケースでは、2番目の質問(「これは以前の研究を無効にしますか?」)が実際にもっと論争的で意見に基づいています。しかし、この場合、明確に定義された数学的問題があると思います。そして、私が以下の私の回答(明快さと簡潔さのためにもう一度書き直しました)で示したように、MillerとSanjurjo(2015)は実際にGilovich、Mallone、およびTversky(1985)の結論を無効にすることに成功しています。
ケニーLJ

@KennyLJ、彼らは1985年の論文の証拠の1つが無効であることを示しました。これは結論が無効であることを示すこととは非常に異なる質問です。例えば、ホットハンド効果が確実に存在することを示すことです。
-usul

回答:


6

(この回答は、2017年7月に明確さと読みやすさのために完全に書き直されました。)

コインを100回連続でひっくり返します。

p^(H|3T)p^(H|3H)

x:=p^(H|3H)p^(H|3T)

コインフリップがiidの場合、「明らかに」100のコインフリップの多くのシーケンスにわたって、

(1)は、x < 0と同じ頻度で発生することが予想されますx>0x<0

(2)E(X)=0

100個のコインフリップの100万シーケンスを生成し、次の2つの結果を取得します。

(I)は、x < 0とほぼ同じ頻度で発生しますx>0x<0

(II)ˉ Xの平均X百万の配列にわたります)。x¯0x¯x

したがって、コインフリップは確かにiidであり、ホットハンドの形跡はないと結論付けます。これはGVT(1985)が行ったことです(ただし、コインフリップの代わりにバスケットボールショットを使用)。そして、これが彼らがホットハンドが存在しないと結論づけた方法です。


パンチライン:驚いたことに、(1)と(2)は間違っています。コインフリップがiidの場合、代わりに

(1修正)は約37%の時間のみ発生しますが、x < 0は約60%の時間発生します。(残りの3%の時間では、x = 0またはxは未定義です。100回のフリップで3Hのストリークまたは3Tのストリークがなかったためです。)x>0x<0x=0x

E(X)0.08

関係する直観(または反直観)は、他のいくつかの有名な確率パズルのそれに類似しています:モンティホール問題、2人の少年の問題、および(カードゲームブリッジの)制限された選択の原則。この答えはすでに十分に長いので、この直感の説明はスキップします。

そして、GVT(1985)によって得られた(I)と(II)の結果は、実際にはホットハンドを支持する強力な証拠です。これは、Miller and Sanjurjo(2015)が示したものです。


GVTの表4。

GVT(1985)を読むことを気にせずに、多くの人(例:@scerwin)は、この文脈で「訓練された統計学者」が平均をとるという不信を表明しました。

しかし、それはまさにGVT(1985)が彼らの表4でしたことです。彼らの表4、列2-4と5-6の下の行を見てください。彼らは26人のプレイヤーの平均であることがわかり、

p^(H|1M)0.47p^(H|1H)0.48

p^(H|2M)0.47p^(H|2H)0.49

p^(H|3M)0.45p^(H|3H)0.49

k=1,2,3p^(H|kH)>p^(H|kM)

しかし、平均の平均(一部の人が信じられないほど愚かであると見なされる動き)をとるのではなく、分析をやり直して26人のプレーヤー(各100ショット、一部の例外を含む)で集計すると、次の加重平均の表が得られます。

Any                     1175/2515 = 0.4672

3 misses in a row       161/400 = 0.4025
3 hits in a row         179/313 = 0.5719

2 misses in a row       315/719 = 0.4381
2 hits in a row         316/581 = 0.5439        

1 miss in a row         592/1317 = 0.4495
1 hit in a row          581/1150 = 0.5052

たとえば、この表では、26人のプレーヤーが合計2,515ショットを撮影し、そのうち1,175または46.72%が撮影されたとしています。

そして、プレイヤーが3つ続けてミスした400のインスタンスのうち、161または40.25%がすぐにヒットしました。また、プレイヤーが3回連続でヒットした313のインスタンスのうち、179または57.19%の直後にヒットしました。

上記の加重平均は、ホットハンドを支持する強力な証拠のようです。

射撃実験は、各プレイヤーが自分のショットの約50%を作成できると判断された場所から射撃するように設定されていることに留意してください。

(注:表1では、Sixersのゲーム内射撃と非常によく似た分析を行うために「奇妙に」十分に、GVTは代わりに加重平均を提示します。確かに、表4の加重平均を計算しました—私が上に示した数値は、彼らが見たものが気に入らず、それらを抑制することを選択しました。


HHHTTTHHHHHHp^(H|3T)=1/1=1

p^(H|3H)=91/920.989


PS GVT(1985)の表4には、いくつかのエラーが含まれています。少なくとも2つの丸め誤差を発見しました。また、プレーヤー10の場合、列4と列6の括弧内の値は、列5の括弧内の値の合計に1足りません(下の注記とは異なります)。私はジロビッチに連絡しました(トヴェルスキーは死んでおり、バローンはわかりません)。残念ながら、彼には元のヒットとミスのシーケンスがありません。表4はすべてです。


1985年GMTの表4を見ると、26人の生徒をテストしたところ、統計的に有意な「ホットハンド」の例が1つだけ見つかりました(各ケースをp <0.05でチェックしました)。これがグリーンジェリービーン効果です。余談ですが、各生徒が自分のショットの約50%を作成できるように正確に配置されていた場合、100のうち40から60の範囲外のヒット率があったはずの生徒は7人未満でした。大規模なホットハンド効果があります)
ヘンリー

4

(免責事項:私はこの文献を知りません。)MillerとSanjurjoには特定の統計的尺度に対する有効な批判があるように思えます。ホットハンド効果に関する以前のすべての作業を無効にするためにこれを考慮する必要があるかどうかはわかりません。なぜなら、彼らはこの特定の手段のみに焦点を当てているからです。

メジャーは

M:=P(make shot | made previous shot)P(make shot | miss previous shot)
P(X)X

MEM>0EM=0

EM<0M

M


3

2つの論文のどちらも、統計の適用に関して十分に明確ではないため、この回答では説明を試みます。

Gilovich、Mallone、およびTversky(1985)は、アブストラクトで「ホットハンド効果」を次のように定義しています。

バスケットボール選手もファンも、プレーヤーがショットを打つチャンスは、前のショットのミスを追うよりもヒットした後のほうが大きいと信じがちです。

kHkkMk

(1)P(HHk)>P(HMk),k1

コンパクト化のために、問題のショットは連続したヒットまたはミスの直後のショットであることが理解されます。これらは、理論的な条件付き確率(つまり定数)であり、条件付きの相対的な経験的頻度ではありません。

P^(HHk),P^(HMk)

Ho:P(HHk)P(HMk)=0

P(H)

TP^(HHk)P^(HMk)

T

T

したがって、ジロビッチらに問題がある場合論文、それはホットハンドの定義ではなく、帰無仮説の定式化でも、使用する統計量の選択でもありません。テストを実行するために使用される重要な値の有効性です(暗黙の分布仮定の場合)、実際に有限の小標本分布(帰無仮説の下)が視覚的にゼロで非中心であり、非対称である場合。

このような場合、通常、テストを実行するために特別な臨界値をシミュレーションで取得します(たとえば、ユニットルートのDickey-Fullerテストの特別な臨界値を思い出してください)。Miller-Sanjurjoの論文ではそのようなアプローチを見ることはできませんでした。代わりに、彼らは「平均バイアス調整」を実行し、この調整の後、テストの結論が逆転することを発見しました。これが進むべき道かどうかはわかりません。

200n=100p=0.5
T3=P^(HH3)P^(HM3)0.08070.07262.5%負の値の。経験的ヒストグラムは

ここに画像の説明を入力してください


1

私の見解では、MillerとSanjurjoは単に表1の相対周波数を誤って計算しました。4つのコインフリップの各シーケンス内で発生するサブシーケンスHHおよびHTの数をカウントする2つの新しい列が追加されたテーブルを以下に示します。目的の条件付き確率p(H | H)を取得するには、これらのカウントN(HH)とN(HT)を合計し、次に示すように分割する必要があります。これを行うと、予想どおりp(H | H)= 0.5になります。何らかの理由で、MillerとSanjurjoは最初に各シーケンスの相対頻度を計算し、次にシーケンス全体で平均しました。それは間違っています。

Sequence     Subsequences       N(HH) N(HT)    p(H|H)
TTTT  ->  TT.. , .TT. , ..TT      0     0        -  
TTTH  ->  TT.. , .TT. , ..TH      0     0        -  
TTHT  ->  TT.. , .TH. , ..HT      0     1       0.0 
THTT  ->  TH.. , .HT. , ..TT      0     1       0.0 
HTTT  ->  HT.. , .TT. , ..TT      0     1       0.0 
TTHH  ->  TT.. , .TH. , ..HH      1     0       1.0 
THTH  ->  TH.. , .HT. , ..TH      0     1       0.0 
THHT  ->  TH.. , .HH. , ..HT      1     1       0.5 
HTTH  ->  HT.. , .TT. , ..TH      0     1       0.0 
HTHT  ->  HT.. , .TH. , ..HT      0     2       0.0 
HHTT  ->  HH.. , .HT. , ..TT      1     1       0.5 
THHH  ->  TH.. , .HH. , ..HH      2     0       1.0 
HTHH  ->  HT.. , .TH. , ..HH      1     1       0.5 
HHTH  ->  HH.. , .HT. , ..TH      1     1       0.5 
HHHT  ->  HH.. , .HH. , ..HT      2     1       0.66
HHHH  ->  HH.. , .HH. , ..HH      3     0       1.0 
                                 --    --       ----
                                 12    12       0.40
                            p(H|H)=N(HH)/N(H*)
                                  =12/(12+12)
                                  =0.5

彼らの議論は、個々のTTおよびTHの発生を計算するのではなく(あなたがしたように)確率p(H | H)を平均する必要がある(すべてのシーケンスが等しく発生する可能性があるため)。
Giskard 2015

1
たぶん、より単純なテーブルはそれらのエラーをより明白にするでしょう。TTHTとHHHHの2つの特定の4フリップシーケンスのみを許可しましょう。これらは、TT、TH、HT、HH、HH、HHの2フリップサブシーケンスを提供します。このリストから、最初に反転したコインがHを示すとき、別のHが続く可能性が非常に高いことは明らかです(これは4回のうち3回発生します)。まさに「ホットコイン」!しかし、TTHTとHHHH(0.0と1.0)の周波数の平均は0.5であるため、MillerとSanjurjoの方法では熱はまったく予測されません。一方、通常の方法では正しい答えが得られます:p(H | H)= 3 /(3 + 1)= 0.75。
scerwin 2015

彼らのポイントは、あなたが指摘するこの「エラー」は、以前の研究者がやったこととまったく同じだったと思う。
ケニーLJ

1
多分。しかし、以前の研究者についてのその主張は正しいですか?ミラーとサンジュルジョが表1で行ったように、訓練を受けた統計学者が確率を計算することはありません。これは、最初に各ゲームの平均を計算し、次にゲーム全体の平均をとって野球選手の打撃平均を計算することに似ています。それは単に間違っています。
scerwin

「しかし、以前の研究者についてのその主張は正しいですか?訓練された統計学者は、ミラーとサンジュルジョが表1で行った方法で確率を計算することはありません。」おそらく、実際に時間をかけて問題の論文を読む必要があります。特にGVT(1985)。
ケニーLJ

0

観察されたシーケンスでは、最後の条件は、後で値がないという意味で「欠落」です。著者は、これが発生した場合を単に無視し、未定義だと言ってこれに対処しています。シリーズが短い場合、この選択は計算に明らかな影響を与えます。図1は、このアイデアの良い例です。


-1

上記のコメントを回答に変更し、元の質問に対する回答は、元の論文が正しいということです。2015年の論文の著者は、コメントで説明しているように、分析に論理的に含める必要があるシーケンスを捨てているため、主張を裏付けるバイアスを導入しています。世界はあるべき姿で働いています。

コメントに対する補遺:論文の表1を見てください。最後の列から4つの値を捨てていることがわかります。そのため、期待される差を得るには、16シーケンスのうち12シーケンスのみを平均します。これらの確率を周波数として見て、最初の行TTTTについて、頭が頭に続く周波数は何であるかを言うと、論理的に常に発生するため、p(H、H )列ではなく、ダッシュ。破棄した他の3つのシーケンスに対してこれを行い、差の期待値は-.33ではなく0であると結論付けます。データの明確な論理的解釈がある場合、そのようなデータを単に捨てることはできません。

ドリフトを消滅させるには、確率を正しく計算する必要がありますが、これは論文では行われていません。表の確率は、「この与えられた4回のトスのシーケンスで、頭が尻尾をたどる確率」であると主張されています。行TTTHの場合、確率は1/3であると信じられていることがわかります。そうではありません。行には4つのトスがあり、その行の4つのトスの1つは、「頭が尾に続く」というイベントです。確率は1/4です。したがって、確率を正しく計算し、すべての行を使用すると、30年間受け入れられた答えが得られます。


質問は、Miller and Sanjurjo(2015)が、以前の研究者が間違いを犯した(そしてその結果、ホットハンドを検出できなかった)ことを指摘する上で正しいかどうかです。もしそうなら、説明してください。そうでない場合も説明してください。問題は、「そのようなデータを単に捨てる」ことができるかできないか、または「世界が本来どおりに機能する」かどうかではありません。
ケニーLJ

MillerとSanjuroは、分析に論理的に属するデータを破棄し、世界にないバイアスを導入するため、正しくありません。
user164740
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.