1000のうち600が10のうち6よりも説得力があるのはなぜですか?


41

「スタディスキルハンドブック」、Palgrave、2012年、Stella Cottrell著、155ページからのこの抜粋をご覧ください。

パーセンテージパーセンテージが与えられると通知します。
代わりに、上記のステートメントが次のようになっているとします:

60%の人がオレンジを好んだ。40%がリンゴを好むと答えました。

これは説得力があるように見えます:数値が与えられています。しかし、60%と40%の違いは重要ですか?ここでは、何人の人が尋ねられたかを知る必要があります。1000人が600人のオレンジを好む人を尋ねられた場合、その数は説得力があるでしょう。ただし、10人だけが質問された場合、60%は6人がオレンジを好んだことを意味します。「60%」は、「10のうち6」ではできない方法で説得力があるように聞こえます。重要な読者として、不十分なデータを印象的に見えるようにするために使用されているパーセンテージを監視する必要があります。

統計でこの特性は何と呼ばれますか?私はそれについてもっと読みたいです。


38
サンプルサイズが重要
Aksakal

36
私はランダムに2人を選んでいますが、どちらも男性です。したがって、アメリカ人の100%が男性であると結論付けます。納得?
ケーシー

2
それは「リンゴとオレンジを比較しない」原則です
-wolfies

2
別の角度からその質問にアプローチするには、フレーミング効果の文献を掘り下げることを検討してください。ただし、それは認知バイアスの例であり、統計的ではなく心理的トピックです。
-Larx

2
見積数量にどの程度影響するかは1の違いを想像できます。7/10は、601/1000が600/1000からであるのに対し、6/10からはかなり遠いです。
mathreadler

回答:


54

別の直観的な例をリストしたいと思います。

コインフリップの結果を予測できると言ったとします。あなたは信じていないし、私の能力をテストしたい。

あなたは5回テストしました、そして、私はそれらすべてを正しくしました。私には特別な能力があると思いますか?そうでないかもしれない。私はそれらすべてを偶然に手に入れることができるからです。(具体的には、コインが公正なコインであり、各実験は独立しており、その後、私はすべての権利を取得することができたとなしスーパーパワーで。を参照してくださいShufflepantsのリンクそれについての冗談のために)。0.550.03

一方で、もしあなたが何度も私をテストしたなら、偶然それを手に入れることはまずありえない。たとえば、回テストした場合、すべてが正しくなる確率はです。0.5 10001000.51000


統計概念はウィキペイダの統計的検出力と呼ばれます

二項仮説検定の検出力は、対立仮説(H1)が真である場合に検定が帰無仮説(H0)を正しく拒否する確率です。

スーパーパワーオンコインフリップの例に戻って、基本的に仮説のテストを実行します。

  • 帰無仮説(H0):私には超大国がありません
  • 対立仮説(H1):私には超大国がある

数値の例で見ることができるように(5回テスト対100回テスト)、統計的検出力はサンプルサイズの影響を受けています。

ここを読むためにもっと。(より技術的で、t検定に基づいています)。

統計的検出力を理解するためのインタラクティブなツールは、ここにあります。統計的検出力はサンプルサイズによって変化することに注意してください!

ここに画像の説明を入力してください


24
必須XKCD
Shufflepants

5
これは実際には質問に答えません。質問には「なぜ説得力があるのか​​」と「統計でこの特性は何と呼ばれているのか」という2つの部分があります。例で読者にもっと納得させるかどうかを読者に尋ねる例を提供しましたが、現象を説明しておらず、なぜそれがより説得力があるのを説明しようとしませんでした(単一の例で読者の直感的な推論に頼るだけです)。さらに、2番目の質問には触れていません。この現象に名前がないと思われる場合は、明示的に述べてください。
Makyen

1
@Maykenそれは明らかに試みられた答えです。それは最大の答えではなく、完全な答えではありませんが、部分的またはソクラティックな答えは、それがまったく答えではないと主張する根拠ではありません。質問は1つの質問をする必要があり、一連の質問をする場合は、それらの一部のみに対処するのが(理想的でない場合)完全に合理的だと思います。あなたがそれが貧弱な答えだと思うなら、あなたは確かにあなたが問題として見ている問題に取り組む自由です。[その点については、2番目の質問にも答えたとは思わない。効果についてのみ説明しました。すべての現象に明示的な名前があるわけではない]
-Glen_b

1
私は仕方がありませんが、100%は特別なケースであり、この答えは、600/1000が6/10よりも説得力があるという私の直感を実際にはサポートしていません。特別なケースではないと考えても、これは本質的に問題を別の割合で表しています。
-NotThatGuy

2
@Juyaそれは誰かが作成したウェブベースのツールです。ここで
ハイタオデュ

29

μ=# of sucessesn

この数量の標準誤差はと推定されますμ(1μ)n.155.0155


17

この概念は多数の法則の結果です。ウィキペディアから、

法律によれば、多数の試行から得られた結果の平均は期待値に近く、より多くの試行が行われるとより近くなる傾向があります。

小さなサンプルからの結果は、大きなサンプルからの結果よりも期待値から遠い場合があります。したがって、質問で述べたように、小さなサンプルから計算された結果には注意が必要です。アイデアは、このyouTubeビデオでも非常によく説明されています。


5
統計では「多数の法則」として知られているいくつかの有名な定理がありますが、それらのどれも問題のようなステートメントを作成しません。では、どうやって接続を確立しますか?
whuber

3
wikipedia en.wikipedia.org/wiki/Law_of_large_numbersから、「法律によれば、多数の試行から得られた結果の平均は期待値に近いはずであり、より多くの試行が実行されるにつれて近づく傾向がある」 。小さなサンプルからの結果は、大きなサンプルからの結果よりも期待値から遠い場合があります。したがって、質問で述べたように、小さなサンプルから計算された結果には注意が必要です。
エヴァンフィブス

6
それは良い説明です、ありがとう。法律を信頼するために必要な「多数の試行」の回数に注意する必要があると書くのは正しいことですが、アプリケーションは直感的に健全です。あなたの説明はあなたの答えに属し、コメントに埋もれるのではなく、より広く読まれて感謝されることをお勧めします。説明なしのリンクのみの回答(Youtubeへのリンクなど)はここでは続きません。
whuber

6

現在、いくつかのサンプル量からいくつかの人口量を推定しています。この場合、人口の割合を推定するためにサンプルの割合を使用していますが、原則はかなり一般的です。

10101

(ランダムサンプリングを使用して)より大きなサンプルを取得すると、サンプル平均は母平均に収束する傾向があります。(これは多数の法則です。)

しかし、私たちが本当に考えたいのは、私たちがどれだけ遠くにいるかです(比率の信頼区間の幅、または通常そのような幅の半分である誤差のマージンによって表されるかもしれません) 。

120

サンプル平均の分布の標準偏差は、サンプル平均が減少している母平均からの典型的な距離を測定する1つの方法です(として減少します)1n

その結果、サンプルが大きい場合の推定の精度についてより自信があります-もう一度実験を繰り返した場合、他のそのような手段は現在のものに近くなります-それらはますます密集し、 (この場合)推定値に偏りがないため、推定しようとしている値を中心にクラスター化されています。単一のサンプル平均は、母集団平均がどこにあるかについて、ますます情報になります。


4

オレンジが好きな人の数を数える、または放射性崩壊によるガイガーカウンターの「クリック」の数を数えるなど、「カウント」統計の経験則は、カウントのエラーマージンがほぼ正方形であることです。 -期待されるカウント値のルート。カウント統計はポアソン統計として知られています。

6の平方根は2.4に近いため、誤差は約40%(2.4 / 6)です。600の平方根は24に近いため、誤差は約4%(24/600)です。これが、6をカウントするよりも600をカウントする方が重要な理由です。相対誤差は10分の1です。

私は、エラーのマージンの定義について少しだらしていません。これは実際には1シグマの値であり、厳密なカットオフではありませんが、ほとんどの測定値(68%)が存在すると予想される範囲です。したがって、6人のオレンジを食べる人がいる場合、6、6、5、6、7、2、4、6、3、5、6、 6,7,6,10,8,6,5,6,6,9,3,7,8。


3

お探しの名前はありませんが、問題は統計的なものではありません。心理的には、人間が脳内で数字を処理する方法は、大きさ(物理的なサイズ)が視覚的に代表値と同じくらい重要なので、小さい数字よりも大きい数字に大きな重み(権限)を与えます。したがって、600/1000は6/10よりも信頼できるように見えます。これが、買い物客が「10%オフ!」の表示を好む理由です。100未満の値と「$ 10を節約!」100を超える値の場合(「Rule of 100」と呼ばれる)。それは私たちの脳が知覚にどのように反応するかについてです。

ニック・コレンダは、この現象や類似の現象の驚くべき外観について、オンライン論文「価格設定心理学への膨大なガイド」で議論しています。


2
他の答えは間違ってはいませんが、引用されたテキストを実際に正しくアドレス指定しているとは思いません。テキストは、数字が実際に正確である場合ではなく、数字と知覚される精度を示すことの影響に対処しています。つまり、1000または60%の600と言うことであなたの情報がより重要であると人に知覚させることができます。実際に述べられていない場合、または場合によってはtrueである場合のサイズ。
dlb

1
私の意見では、この例は根本的に欠陥があるようです。たとえば、100の購入では合計90の%10割引が適用され、100.01の購入では合計75.01の25の割引が適用されるため、結果は大きく異なります。実際、最大250.05(または丸めまたは切り捨てに応じて250.10)になるまで値に違いがあります。問題はサンプルサイズと標準誤差についてですが、あなたの例は私たちの認識による実際の違いについてのものです。
ジョーW

@ジョーW、「100のルール」の詳細(心理学者ではない)に話すことはできませんが、私の答えは、心理学者は人々がより大きな数字ではなく、より大きな数字を信頼していると判断したことですそれが表すサンプルサイズですが、より大きな数に与えられたより大きな重要性の認識のため。エンジニアとして、私はそれがこの方法ではないことを望みます---しかし、それは人間の心が働く方法です。これに挑戦したい場合は、Kolenda氏のプレゼンテーションの根底にある詳細を読むことをお勧めします。
-JBH

あなたは私の論点を見逃しています、10%から100%と25%には大きな違いがあります。それは単なる認識の問題ではありません。あなたは100で両方の値を取った場合の単純な事実は、2つの異なる試料10の1〜1000のいずれかを話すとき、その後の標準誤差を測定することがはるかに簡単である値である15%の差があるある
ジョー・W

質問を変更して、10%と10ドルを使用するようにしました。「100のルール」のポイントは、人々がより大きな数字をより大きな関連性を持つと認識し、金銭的価値を単なるパーセンテージよりも重要であると認識することです。これは、OPの目的のための議論の範囲外の問題です。
-JBH

3

一方で、実際の誤差の範囲が重要であり、それは理由に聞こえるより説得力があるため、人々の経験よりヒューリスティック(経験則)です。実際の許容誤差により、このヒューリスティックにメリットがあることが確認されます。

サンプルが6に対して4に対して、1人が投票を変更した場合、または1人が誤って記録された場合、これは50/50になります。6側にはさらに2人しかいません。誰もが2つのフレークを知っており、サンプルがチェリーピッキングされる可能性があることを誰もが知っています。または、大学のホールにいる10人の大学教授だけに投票しました。または、サックスフィフスアベニューの外にいる10人の裕福な人々に尋ねました。

誤差の数学的マージンでさえ、真のランダム性を前提としており、選択の偏りや自己選択の偏りなどを考慮していません。人々はそれを直感的に理解できます。

対照的に、600対400の結果では、一方の側に他方よりも200人多くの人がいて、100人の人が心を変える必要があります。これらの数字は、あなたが投票している場所、どのように人々に同意してもらうか、個人がどのように質問を理解または解釈したかなどの偶然によって、非常に難しい(不可能ではない)。

数学的な証拠があるからではなく、10のグループよりも1000の群衆が(何でも)意見が多様である可能性が非常に高いことを経験から知っているので、より説得力があります。政党大会やKKK集会での投票、または一方的な群衆を引き寄せそうな何か)。

数学は、直観によってすでに知っていることを正確に定量化するだけです。10個のうち1個または2個の迷票にランダムに遭遇する方が、1000個のうち100個または200個の迷票にランダムに遭遇するよりも簡単です。


3

言及されていないことは、ベイジアンの観点から問題を見ることです。

pp

pBeta(α,β)no|pBin(n,p).

β=αβ=α=1pU(0,1)

nnona=nno

p

p|no,naBeta(no+1,na+1).

pno/(no+na)n

no=6na=4

n_o = 6およびn_a = 4の後方

no=600na=400ここに画像の説明を入力してください

p=0.4p=0.8

これらのプロットはdavid25272のプロットに似ていますが、非常に異なるものを表していることに注意してください。

pno

nop


2

短い答え:

基本的に、10のうち6つよりも1000のうち600を持っている方が説得力があります。なぜなら、同じ好みが与えられた場合、10のうち6が偶然に発生する可能性がはるかに高いからです。

オレンジとリンゴを好んだ人の割合は実際には等しい(つまり、それぞれ50%)と仮定します。これを帰無仮説と呼びます。これらの等しい確率を考えると、2つの結果の尤度は次のとおりです。

  • 10人のサンプルを考えると、オレンジを好む6人以上のサンプルをランダムに取得する可能性38%です(これはそれほど可能性が高いわけではありません)。
  • 1000人のサンプルでは、​​1000人のうち600人以上がオレンジを好む可能性は10億分の1未満です

(簡単にするために、無制限の数のサンプルを抽出する無限の母集団を想定しています)。


簡単な派生

この結果を導き出す1つの方法は、サンプルで人々が組み合わせることができる潜在的な方法をリストすることです。

10人にとっては簡単です。

リンゴやオレンジを好む無限の人々から無作為に10人のサンプルを引き出すことを検討してください。好みが同じであれば、10人の潜在的な組み合わせをすべて簡単にリストできます。

完全なリストは次のとおりです。

r   C (n=10)    p
10  1       0.09766%
9   10      0.97656%
8   45      4.39453%
7   120     11.71875%
6   210     20.50781%
5   252     24.60938%
4   210     20.50781%
3   120     11.71875%
2   45      4.39453%
1   10      0.97656%
0   1       0.09766%
    1024    100%

rは結果の数(オレンジを好む人)、Cはオレンジを好む多くの人の可能な方法の数、pはサンプルでオレンジを好む多くの人の結果の離散確率です。

(pは単にCを組み合わせの総数で割ったものです。これら2つの設定を合計で1024通り(2の10乗)する方法があることに注意してください。

  • たとえば、10人(r = 10)がオレンジを好む方法は1つ(1つのサンプル)しかありません。同じことは、リンゴを好むすべての人に当てはまります(r = 0)。
  • 10種類の組み合わせがあり、そのうち9種類がオレンジを好んでいます。(各サンプルでリンゴを好む人がいます)。
  • 2人がリンゴなどを好む45のサンプル(組み合わせ)があります。

(一般に、n人のサンプルからの結果rのn C rの組み合わせについて話します。これらの数値を検証するために使用できるオンライン計算機があります。)

このリストにより、除算のみを使用して上記の確率を得ることができます。サンプルでオレンジを好む人が6人になる確率は21%です(1024個の組み合わせのうち210個)。サンプルに6人以上が参加する可能性は38%(6人以上のすべてのサンプルの合計、または1024個の組み合わせのうち386個)です。

グラフィカルに、確率は次のようになります。

二項標本サイズ10

数値が大きくなると、潜在的な組み合わせの数が急速に増加します。

わずか20人のサンプルの場合、1,048,576のサンプルがあり、すべて同等の可能性があります。(注:以下では2つおきの組み合わせのみを示しています)。

r    C (n=20)   p
20   1          0.00010%
18   190        0.01812%
16   4,845      0.46206%
14   38,760     3.69644%
12   125,970    12.01344%
10   184,756    17.61971%
8    125,970    12.01344%
6    38,760     3.69644%
4    4,845      0.46206%
2    190        0.01812%
0    1          0.00010%
     1,048,576  100%

20人すべてがオレンジを好むサンプルはまだ1つしかありません。混合された結果を特徴とする組み合わせは、サンプル内の人々を組み合わせることができる方法がもっとたくさんあるという理由だけで、はるかに可能性が高くなります。

バイアスがかかっているサンプルは、それらのサンプルをもたらす可能性のある人々の組み合わせが少ないという理由だけで、かなりありそうにありません。

各サンプルに20人しかいないため、サンプルにオレンジを好む人が60%以上(12人以上)になる累積確率は、わずか25%に低下します。

確率分布はより薄く、より高くなることがわかります。

二項標本サイズ20

1000人の人数は膨大です

上記の例をより大きなサンプルに拡張できます(ただし、すべての組み合わせを一覧表示するには実行できないほど急速に数が増えます)。代わりに、Rの確率を計算しました。

r   p (n=1000)
1000    9.332636e-302
900     5.958936e-162
800     6.175551e-86
700     5.065988e-38
600     4.633908e-11
500     0.02522502
400     4.633908e-11
300     5.065988e-38
200     6.175551e-86
100     5.958936e-162
0       9.332636e-302

1000人のうち600人以上がオレンジを好む累積確率は、わずか1.364232e-10です。

確率分布は、中心部に集中するようになりました。

[二項標本サイズ1000 [3]

(たとえば、R使用dbinom(600, 1000, prob=0.5)でオレンジを好む1000人のうち正確に600人の確率は4.633908e-11に等しく、600人以上の確率1-pbinom(599, 1000, prob=0.5)は1.364232e-10(10億分の1未満)になります。


1

これは、数値が大きいほど精度が高くなるためです。たとえば、惑星上の任意の場所から1000人のランダムな人々をピックアップし、そのうちの599人が男性6人のランダムな10人に対して男性である場合、前者の方がより正確です。同様に、70億の人口を想定して男性の数を計算すると、1000人よりも明らかに正確な数が得られます。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.