信頼区間はクォータサンプリングに適用されますか?


9

フランスの投票機関は最近、2012年の大統領選挙の競馬レースでこれまで最もばかげた投票としか呼べないものを発表した後、現在大きな危機に直面しています。フランス上院は現在、特に投票所に結果の信頼区間を公開するよう強制することにより、この問題を立法化することを検討しています。

ただし、一部の世論調査員はこの対策に反対しており、信頼区間はフランスの投票所で使用されている割り当てのサンプリングには適用されないと主張しています。割り当てのサンプリングは正式には非確率論的サンプリングであるため、主張にはいくつかの真実があります。しかし、割り当てサンプリングは基本的に層別サンプリングであるため、信頼区間を適用する必要がありますよね?

フランス以外で、世論調査担当者も割り当てのサンプリングを使用している国で、この問題についての経験をお願いしてもよいですか


5
クォータサンプリングは、この点で層別サンプリングとは異なります。層別サンプルでの選択とは異なり、割り当てサンプリングのランダム性の欠如は、バイアスの欠如を保証できないことを意味します。したがって、クォータサンプリングからの推定値に対してCI 構築することはできないかもしれませんが、バイアスの間隔を確立できます。残念ながら、サンプルが母集団のかなりの割合である場合を除いて、バイアスはほぼ-100%からほぼ+ 100%に広がっています。これが、クォータサンプルが長い間信用されていない理由です(「デューイがトルーマンを倒す」など)。 買い手責任負担。
whuber

世論調査員は、フランスの業界標準である割り当てのサンプリングがイギリスと南ヨーロッパの州でも広まっていると主張しています。英国が本当にクォータサンプリングを使用しているのでしょうか、そしてバイアスが修復不可能な場合、なぜそもそもクォータサンプリングを使用するのでしょうか。
神父

1
@Fr Quotaサンプリングは、ランダムサンプリングよりも実行が簡単です。世論調査員は、必要な被験者の種類と面接する人数を指定し、面接担当者をこれらの指示に従って通りに送り、仕事が正しく行われたかどうかを簡単に確認できます。サンプリングフレームの確立、そこからの確率サンプルの抽出、メンバーの追跡、無回答者の追跡などの困難な作業を行うため。割り当てのサンプリングは、時代遅れの既知の悪いサンプリング方法の教科書のポスターです。たとえば、math.uah.edu / stat / data / 1948Election.pdfを参照してください。
whuber

@whuber:詳細をありがとう。「デューイはトルーマンを倒す」という話を知っていた。以前に引用された文書で主張されているように、英国の投票所が実際に割り当てのサンプリングを使用していることはまだ疑わしく、確認する必要があります。最大の国々で異なる業界標準が何であるかを知ることは興味深いでしょう。私がICPSRからダウンロードするデータのほとんどがRandom Digit Diallingであることを知っています。
神父

1
多くの非専門家(つまり、サンプリングの背後にある統計理論を理解していない人)は、それが何を意味するのかを本当に知らなくても、「クォータサンプリング」という用語を使い回しています。それはイギリスと南ヨーロッパでは一般的な慣行だという主張を説明しているかもしれません。
阿部

回答:


6

whuberが言うように、簡単な答えは、クォータサンプルは「時代遅れの既知の悪いサンプリング方法のポスターの子」であり、「長い間信用されていない」ということです。より長い答えは、「クォータのような」サンプルが適度にうまく機能する条件があるかもしれないということです。

展示Aは、オプトインのインターネットパネルからの代表的な結果の再構築に関する最近の作業です。このペーパーでは、このアプローチの統計的根拠を示します。長い話を短くするために、典型的なサンプリングスキームは、1)ランダムなサンプルを引き、2)被験者を募集することを試み、次に3)層化後の重みを追加して、応答する人の違いを補償します。オプトインアプローチでは、1)非ランダムに被験者を募集し、2)応答を代表的なベースラインと比較し、3)重みを追加して差異を補正します。

実践の面では、オプトインサンプリングはクォータサンプリングに似ていますが、統計的基盤はさらに発展しています。利点は、代表的なサンプリング、信頼区間などについて主張できることです。欠点は、人々がサンプルをどのように選択するかについて、検証が難しい仮定に基づいていることです。

多くの人々はこれらの方法に懐疑的です-彼らは割り当てサンプリングのように聞こえすぎます。しかし、一部の証拠は、オプトインサンプリングが少なくともしばらくはうまく機能することを示唆しています。したがって、論争にもかかわらず、Polimetrix / YouGov(オプトインサンプリングモデルの早期採用者)は、かなりうまくいっているようです。とりわけ、彼らは最近の一連の米国の学術選挙に関する共同議会選挙調査のすべてのデータ収集を行いました。

(私はICPSRがこのデータを運ぶと確信しています。そうでない場合、ハーバードの社会科学データバースは確かに行います。多くの学者がこれらのサンプルからのデータを使用しています。)

とにかく、割り当てのサンプリングについて質問しました。すでにここのコメントスレッドで確認できるように、十分に訓練された世論調査員は、クォータサンプリングが2段であると伝えます。陪審員はまだオプトインサンプリングについて出ていません。当面は、クォータサンプルの周囲に信頼区間を描画する場合は、これらの方法が最善の策だと思います。


詳細な回答ありがとうございます。その中で次の点にフラグを付けました。(1)例では、インターネットサンプリングに割り当てサンプリングが使用されています。そのコンテキスト外では、RDDまたは同等の手法によるランダムサンプリングでそれを使用する理由はありません。(2)あなたが説明する文脈においてさえ、それは非常に物議を醸し続けています。したがって、私の質問に戻ると、すべての仕事の割り当てサンプリングを正当化するフランスの世論調査員は、愚かであるか、サンプリング理論を知らないか、またはその両方です。
神父

「フランスの世論調査担当者たちは、すべての仕事の割り当てサンプリングを正当化しているのは、ばかげているか、サンプリング理論を知らないか、あるいはその両方です。」私には正しいように聞こえます。
阿部

ええと、私はその上で「回答済み」をチェックしています。あなたの時間と詳細なリファレンスをありがとう。
神父

2
  1. ほとんどの必須ではない調査の状況では、無回答にはかなりの問題があります。これは2002年以降、「最近報告されたCMORからの調査協力率の見積もり、市場および意見調査委員会[米国]によると、平均はわずか14.7%でした。」そしてポール・ガーホールドから、「私はまだランダムなサンプルを描くことが可能であると信じています。それらを実行することが可能であるとは信じていません。」このコンテキストでは、結果のデータはランダムではないため、サンプルがランダムであるという事実はあまり関係ありません。

  2. これにより、バイアス調整が有効な推定における主要な問題になり、フィールドメソッドの設計が重要なコンポーネントになります。これを実行する方法と、その結果得られる信頼度の見積もりは、ここで説明できる範囲をはるかに超えています。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.