なぜ政治(たとえば、ギャラップ)の統計的サンプリングが必要なのか(?)


14

世論調査(ギャラップなど)は、人口の規模と比較して、ばかばかしいほど少ない人数(たとえば、数億人のうち1000人)をサンプリングしています。

さて、私にとって、母集団の統計を推定する手段として母集団をサンプリングすることは、その標本が母集団(または同様に他の標本)を代表していると信じる強い理由がある場合に意味があります

たとえば、医学研究にとってサンプリングは明らかに理にかなっています。なぜなら、人間はすべて非常によく似たゲノムを持ち、この要因によって体が同様に振る舞うことをアプリオリに知っているからです。
これはある種の疎結合ではないことに注意してください-ゲノムは非常に強力な決定要因です。

しかし、政治的な世論調査などに低サンプルサイズを使用することを正当化する理由はわかりません。

似たような社会経済的/教育的背景のために、近所の人々の80-90%が大統領に同じように投票するかもしれませんが、これはばかばかしいほど少ないサンプルを正当化することはほとんどないようです。文字通り、1000人のランダムな有権者が2億人の他の有権者のように振る舞う理由は(少なくとも私には)説得力のある理由はありません。

私には、少なくともその100倍の(たとえば)が必要です。どうして?私は多くの理由を考えることができます、例えば:

  1. カリフォルニアにはちょうど 22,000の境内があります。人々の経済的および教育的背景は大きく異なっているため、サイズ1000の投票は笑えるほど小さく見えます。平均して1人未満の境内全体をどのように要約できますか?

  2. 一般的に、人々は医学に対する身体の反応を変えることはできませんが、それについて考えるだけで政治についての意見を変えることができます。私が見ているように、政治を扱うとき、医学のDNAに似た強制要因はありません。で最高の私は、相関の小さなポケットがあるはず想像します。

しかし、どういうわけか、このような世論調査は...とにかく動作するように見える?それとも、少なくとも人々はそう思うと思う?
しかし、なぜ彼らはすべきなのでしょうか?たぶん私は基本的にサンプリングを理解していませんか?誰か説明できますか?
私は真剣に見ている世論調査のいずれかを取ることはできませんが、これで多かれ少なかれ一人でいるように感じています...


4
「人間のゲノムはすべて似ていることをアプリオリに知っているので、サンプリングは明らかに医学研究に意味があります」私は医学的背景はありませんが、私たちのDNAは実際には政治的見解よりも小さいのですか?もしそうなら、なぜ遺伝学を研究するのがそんなに難しいのか、そしてなぜ我々はそれをすでに完全に理解していないのか?ランダムな人を2人連れて行けば、同じ政治的見解を持ち、同じDNAを持つ可能性が高くなると思います。
ティム

3
@ティム:「あなたが2人のランダムな人々を連れて行くと、彼らは同じ政治的見解を持ち、同じDNAを持つ可能性が高くなるだろうと賭けます。」どれくらい賭けたいですか?google.com/search?q=dna+similarity+between+humans
user541686

2
しかし、このような比較を行う場合、0.5%の差最も重要ではないでしょうか?また、ハエと60%の遺伝子を共有しているので、医学研究のために人間とハエを交換可能にサンプリングできると思いますか?比較:2008年、オバマ大統領は米国大統領選挙で53%の票を得ました。さらに、命を救うが潜在的に危険な薬物を研究するときは、A社とB社によって製造された石鹸を使用すること、または意見のプールに対する選好について研究するときよりもサンプリングに注意する必要があると主張します。
ティム

2
@ user2338816:「歴史的に正確であるため、説得力があります」は数学とは異なり、科学と似ています。科学的根拠に基づいて購入することは完全に喜んでいます(それが科学の流れであるためです)。
user541686

1
私は、世論調査が選挙のために働くという(慎重な)主張に挑戦します。投票は、私が出身の選挙の実際の結果に近いことさえ覚えていません。本当に説明できない要因が多すぎます-たとえば、約60%の出席率では、投票しない人よりも投票しない人をサンプリングする可能性が高くなります。アンケートへの参加は、投票よりも労力が少なく、場合によっては報酬も得られます。一部の政党は、共産党など他の政党よりもはるかに出席率が高い。サンプリングでは、偏差と「結果」を引用する必要があります。
ルアーン

回答:


13

非常に単純なサンプリングモデルを想像しているようです。

サンプリングの最も単純なモデルは、適切にSimple Random Samplingと呼ばれます。人口のサブセットを選択し(たとえば、電話番号をランダムにダイヤルすることにより)、投票方法に答える人を尋ねます。487人がクリントン、463人がトランプ、そして残りがあなたにいくつかの奇抜な答えを与える場合、投票会社は投票者の49%がクリントンを好み、46%がトランプを好むと報告します。ただし、ポーリング会社はこれ以上のことを行います。単純なランダムサンプルは、すべてのデータポイントに等しい重みを与えます。ただし、サンプルに男性が600人、女性が400人含まれていると仮定してください。これは、明らかに全体の人口を表していません。グループとしての男性が一方に傾く場合、女性が他方に傾く場合、これはあなたの結果を偏らせます。ただし、人口統計は非常に優れているため、重みを付けることができます*女性の反応をもう少し多く、男性の反応を少し少なくして、反応を数えることで、重み付けされた反応が母集団をより良く表します。ポーリング組織には、より代表的なサンプルをより代表的なサンプルに似せることができる、より複雑な計量モデルがあります。

サンプリングされた応答に重みを付けるという考え方は、かなり堅固な統計的根拠に基づいていますが、重みに寄与する要因を選択する際にはある程度の柔軟性があります。ほとんどの世論調査官は、性別、年齢、人種などの人口統計学的要因に基づいて再重み付けを行います。これを考えると、政党の識別(民主党、共和党など)も含めるべきだと思うかもしれませんが、ほとんどの世論調査会社はそれを重みに使用してないことがわかります:党(自己)-識別は有権者の選択に絡み合っていますあまり役に立たない方法で。

多くの世論調査機関も、「有権者」の間で結果を報告しています。これらでは、回答者は実際に投票に参加する可能性に基づいて選択または重み付けされます。このモデルは間違いなくデータ駆動型ですが、要因を正確に選択することである程度の柔軟性が得られます。たとえば、候補者と有権者の人種(または性別)の相互作用を含めることは、2008年または2016年までは賢明でさえありませんでしたが、今はある程度の予測力があると思います。

理論的には、音楽の好み、目の色など、あらゆる種類のものを重み係数として含めることができます。ただし、人口係数は重み係数の一般的な選択肢です。

  • 経験的に、彼らは有権者の行動とよく相関しています。明らかに、白人男性をleanせた共和党員にすることを「強制」する鉄に覆われた法律はありませんが、過去50年にわたって、彼らは傾向がありました。
    • 人口の値はよく知られています(たとえば、国勢調査またはVital Recordsから)

ただし、世論調査員は他の人と同じニュースを表示し、必要に応じて重み付け変数を調整できます。

世論調査の結果を説明するために呼び出される「ファッジファクター」もあります。たとえば、回答者は「社会的に望ましくない」答えをためらうことがあります。ブラッドリー効果は白い有権者が時々人種差別主義者を登場避けるために、少数派に対して実行されている白の候補者への支持を軽視することを断定します。これは、投票で楽にリードしたにもかかわらず、選挙をわずかに失ったアフリカ系アメリカ人の知事候補者、トム・ブラッドリーにちなんで名付けられました。

最後に、誰かの意見を尋ねるという行為自体がそれを変える可能性があるということは完全に正しいです。ポーリング会社は、中立的な方法で質問を書き込もうとします。考えられる応答の順序に関する問題を回避するために、候補者の名前がランダムな順序でリストされる場合があります。質問の複数のバージョンも、相互にテストされる場合があります。この効果は、インタビュアーが実際に回答を収集するのではなく、それらに影響を与えることに関心があるプッシュポーリングの悪意のある目的でも利用できます。たとえば、プッシュ投票では、「彼が児童痴漢であると報告されたとしても、[候補A]に投票しますか?」と尋ねることがあります。


*また、500人の男性や500人の女性など、サンプルに明示的なターゲットを設定することもできます。これは層化サンプリングと呼ばれます。母集団は異なるグループに層化され、各グループはランダムにサンプリングされます。実際には、これは世論調査ではあまり行われません。なぜなら、多くの網羅的なグループに階層化する必要があるからです(たとえば、アーバンテキサスの18〜24歳の大学教育を受けた男性)。


2
私は間違いなく、彼らは、単純なランダムサンプリングをしていない理解して、私の質問は、彼らがいるかどうかについてですされていることは、理由だけでちょうど良いですたまたま自分の仮定は(すなわち、合理的なしかし、主観的な勘で)正しいこと、または前提条件が統計的にもあるかどうか正当。他の回答についての私のコメントはこちらをご覧ください
user541686

3
両方、私は思う。サンプルの重み付けは統計的に正しいことですが、重みに含める要素をどのように選択するかを決定する柔軟性があります。たとえば、人種、性別、および教育はすべて有用ですが、パーティーの識別は多くの場合theguardian.com/commentisfree/2012/sep/27/…)ではないことがわかります。選択。
マットクラウス

1
同様に、重みには、回答者が投票する可能性の推定値が含まれることがあります。若者は多くのノイズを発しますが、常に表示されるわけではありません。高齢者は集会に出席することはめったにありませんが、投票で確実に現れます。これは、過去のデータ(有権者ロールが時々公開されています)から推定することができますが、私は2008年にと2016年の女性のためのアフリカ系アメリカ人のためにそれを調整するいくつかの場所を想像
マット・クラウス

ありがとう!あなたの答えにも「柔軟性」と言うのはいいかもしれません:) +1
user541686

10

「多数の法則」と呼ばれる数学的定理があります。コインが頭に浮かぶ確率を決定したいと想像してください。コインフリップの「人口」は無限であり、米国の3億人以上の人々よりもはるかに多くなっています。しかし、大数の法則によれば、コインフリップを多くすればするほど、見積もりはより正確になります。

理想的な世論調査:理想的な世論調査では、世論調査員は米国国勢調査からランダムに名前を選択し、それらの人々がどこに住んでいるかを見つけ、ドアをノックします。その人が投票を計画していると言うと、投票者は誰に投票するのかを尋ね、その答えを記録します。このようなポーリングは数学的に機能すること保証されており、特定の信頼レベルに対する測定値の誤差量は簡単に計算できます。

エラーの意味は次のとおりです。アンケートに基づいて、Candidate Awesome McPerfectが52%の確率で勝ち、98%の信頼度で3%のエラーが発生したとします。つまり、Awesome McPerfectの候補者を支持する有権者の本当の部分が49%から55%の間であると、98%確信できるということです。

エラーと信頼性に関する注意事項特定のサンプルサイズについて、自信があるほど、エラーは大きくなります。それについて考える-あなたは100%確信している素晴らしいサポートcanditateは0%と100%(可能な限り最もエラー)の間にあること、そしてあなたはサポートが素晴らしいcanditateというのは本当割合が0%自信を持っていることは事実割合を正確に 52.0932840985028390984308% (エラーなし)。信頼性が高いとエラーが増え、信頼性が低いとエラーが少なくなります。ただし、信頼度と誤差の関係は線形ではありません!(参照:https : //en.wikipedia.org/wiki/Confidence_interval

現実世界の世論調査ヘリコプターの世論調査員がランダムな人々のドアをノックするために国のすべての部分に出費するのは高価だからです(私はそれが起こるのを楽しみにしていますが、あなたが億万長者であり、あなたがこれを見るならこれに資金を提供することを検討してください)、現実の世論調査はより複雑です。より一般的な戦略の1つを見てみましょう。ランダムな有権者を呼び出して、誰に投票するかを尋ねます。それは良い戦略ですが、よく知られているいくつかの失敗があります:

  1. 多くの場合、人々は電話に応答せず、投票者に応答することを選択します(例:私)
  2. 一部の人口統計では、固定電話を使用する可能性が高くなります(例:年配の有権者)
  3. 一部の人口統計は、世論調査に回答する可能性が高い(例:年配の有権者)

人口統計はさまざまな方法で投票するため、投票者は、生データ(電話への応答を決定した人に基づく)と実際の選挙の結果の違いを制御するために最善を尽くす必要があります。たとえば、電話に出た人の10%がヒスパニックであるが、前回の選挙での投票者の30%がヒスパニックである場合、投票でヒスパニックの投票者に3倍の重みを与えます。電話に答えた人の50%が60歳以上で、前回の選挙で投票した人の30%だけが60歳以上である場合、回答した年配の有権者の重みは低くなります。それは完全ではありませんが、予測のいくつかの印象的な偉業につながる可能性があります(ネイトシルバーは、統計を使用して2012年の選挙で50州のそれぞれの結果を正しく予測し、

賢者への注意事項世論調査員は、過去の状況に基づいて最善の予測を行います。一般的に言えば、物事は今や過去と同じように機能するか、少なくとも最近の過去(最も焦点を当てている)が現在に似ているほど変化が遅いです。ただし、有権者が急速に変化し、事態が悪化する場合があります。たぶん、トランプの有権者はあなたの平均的な投票者よりも電話に応答する可能性がわずかに低く、人口統計による重み付けはそれを考慮していません。または、おそらくヒラリーを圧倒的に支持する若者はもっとモデルが予測するよりも電話に応答する可能性は低く、電話に応答するモデルは共和党である可能性が高くなります。または、おそらく両方の反対が真実です-私たちは知りません。そのようなものは、一般的に収集される人口統計には表示されない隠された変数です。

私たちは、考え、我々は、我々は人口統計に基づいた重量のものに持っていないだろうが、それまで、指が交差しているので、ランダムドア(エヘン、想像billionareこれを読んで)をノックする世論調査を送ったかどうかを知ります。


3
回答は感謝しますが、私が尋ねようとしていた質問と私のバックグラウンドに比べて少し基本的です(あなたが気づいたかどうかはわかりませんが、確率/統計の基本にはまったく慣れていません)。ここでの私の質問に対する答えは、あなたの質問ほど基本的ではないと思います。たとえば、古典的な多数の法則の前提は、同一の分布を持つランダム変数があるということです...しかし、政治的文脈でそれを正当化することはできません:なぜあなたは私の投票にあなたの分布を置くべきですか?まったく同じ?
user541686

また、私もあなたが正当化しようとしていた事大数の法則を正当化じゃない場合でも、その仮定が満たされます。問題は、(少なくともあなたが提案した方法ではなく)多数の法則が実際に扱っていないサンプルサイズについてです。ここでは、無限大での平均の収束だけでなく、分散または収束率の概念が必要です。多人数の法則ではなく、中心極限定理を呼び出すつもりだったのでしょうか?(ただし、これはおそらく
意味

2
分配は個々の投票には適用されません。個々の投票はランダムではありません。それらは、全体としての人口の投票行動に適用されます。それはurから色のついたボールを描くようなものです-各ボールは赤または青になるように事前に決められていますが、各色を描く確率を持つことができるため、サンプルに基づいて特定の色のボールを描く可能性の分布を構築できます骨ballsのボール
J.アントニオペレス

1
人々と政治以外の何かを見てみましょう。アイスクリームの好きな味は、政治的見解と同じくらい多くのものに依存します。友人の好み、子供時代の思い出、アイスクリームパーラーでの良いまたは悪い経験に依存します。おそらく、彼らは妻や夫との最初のデートでそれを手に入れたので、1つのフレーバーが好きです。おそらく彼らはフレーバーを嫌います。しかし、私がアメリカの人々を無作為に調査した場合、アメリカで一番好きなアイスクリームのフレーバーを判断できることに同意しませんか?
J.アントニオペレス

1
「ランダム変数」とは、世論調査員が自分の好みを尋ねられる人を選択することです。個人の好みはランダムではありません。投票者が選択する個人はランダムです。
J.アントニオペレス

7

まず、これはあなたの主要な点は別ですが、言及する価値があります。医療試験では、1000人の人が薬物をテストし、これを毎年1万人の病気の人に与えることができます。それを見て、「人口の10%でテストされている」と思うかもしれません。実際、人口は10000人ではなく、将来のすべての患者なので、人口規模は無限です。薬物の無限の潜在的使用者と比較して1000人は多くはありませんが、これらの種類の研究は機能します。人口の10%、1%、または0.1%をテストするかどうかは重要ではありません。重要なのはサンプルの絶対サイズであり、母集団と比較した場合の大きさではありません。

次に、あなたの主なポイントは、人々の投票に影響を及ぼす可能性のある交絡変数が非常に多いことです。カリフォルニア州の22000の地区を22000の変数のように扱っていますが、実際にはほんの一握りの変数(あなたが言ったような収入と教育)にすぎません。すべての地区の代表的なサンプルは必要ありません。収入、教育、電気ショックなどによる変動をカバーするのに十分なサンプルが必要なだけです。

kknnσ2nkkσ2n

kn

編集:

上記の式は、各交絡変数が同様に重要であると仮定していました。結果に分散を加えることができる何百ものものを検討したい場合、この仮定は有効ではありません(たとえば、twitterユーザーはもう1人の候補をサポートしますが、twitterの使用は性別ほど重要ではないことを知っています)。

σ20.9σ20.92σ2n=0σ20.9n=10σ2

n10σ2n0.9


答えてくれてありがとう!最初の点に関しては、それは本当だと思いますが、私の人口は、結果が非​​常に似たような強制因子(DNAなど)を持っているので、人間の人口の大きささえ重要ではないということでした任意のサンプル。2番目については、実際にはいくつかの変数が存在する可能性があることを購入できますが、その仮定を数学的に正当化して後で使用する唯一の方法は、最初に多数の人々を実際にサンプリングして実証することですよね?それがなければ、結論はもはや統計的に厳密または正当であるとは思えません。
user541686

実験により、年齢、性別、収入、その他数人が人々の投票パターンの重要な要素であることが確立されており、これも一般的な知識からのみ知っています。投票に影響を与える他の何百もの小さな要因が存在する可能性があり、理論的には重要なものになる可能性がありますが、一般的な知識から、それらは重要ではないことがわかります。この時点で、モデルは厳密に正当化されていませんが、「金髪であることはクリントンに投票するのか、かつらをかぶることは人々がトランプに投票するのか」などの小さな要因をテストします。
ヒュー

「しかし誰が[...]のような小さな要因をテストするのか」 -しかしそれはここの問題です。答えが「私たちが実際にできる限り最高だから/ 仕事が起こるから/そうでなければ費用がかかるから/など」である場合、それは「なぜ彼らは10万人を投票していないのか?」という質問に対する完璧な答えです。 「しかし、それは実際には「1,000人が統計的に正当化できるのか?」に対する答えではありません。Politics.SEとは対照的に、Stats.SEでこれを求めているのはそのためです。さらにサンプルが実用的でないかどうかは気にしません。私の質問は、人々が現在の方法が統計的に正当化されると考える理由です。
user541686

しかし、最後のコメントの最初の数文は合理的な答えのようです。もしあなたがその種の研究が大規模に行われていると言っているなら(数百万人ではないにしても数十万人)、それが仮定の基礎。もしそうなら、彼らは私の質問の核心に対処するので、あなたの答えに追加すべきだと思います(理想的には引用がありますが、少し接線があり、これは政治ではないので、あまりうるさいことはできません) )。
user541686

あなたは、マイナーな要因をテストすることは非現実的ですが、数学的に意味があることは正しいです。答えを編集して、結果に影響を与える何百もの小さな要因を気にしない理由についていくつかの理由を示しました。主要因の影響について行われた研究を見つけることができると確信しています。
ヒュー
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.