母集団全体のデータが利用できる場合、信頼区間を計算し、仮説をテストすることは理にかなっていますか?私の意見では、パラメーターの真の値を正確に計算できるため、答えは「いいえ」です。しかし、それでは、前述の手法を使用できるようにする元の母集団からのデータの最大比率はどのくらいですか?
母集団全体のデータが利用できる場合、信頼区間を計算し、仮説をテストすることは理にかなっていますか?私の意見では、パラメーターの真の値を正確に計算できるため、答えは「いいえ」です。しかし、それでは、前述の手法を使用できるようにする元の母集団からのデータの最大比率はどのくらいですか?
回答:
最初の質問は、一般的に合意されていない回答です。私自身の見解はあなたの見解と似ていますが、人口は「超人口」のサンプルと見なすことができ、超人口の正確な性質は状況によって異なると主張する人もいます。建物は、同様の建物に住んでいるすべての人々からのサンプルと見なすことができます。米国の人口調査(本当に完全であるとは限らない)は、ある日存在するかもしれないアメリカ人(またはそのようなもの)の超人口からのサンプルと見なすことができます。これは、p値を使用するための言い訳になることが多いと思います。実体分野の多くの科学者は、p値を取得していないと快適ではありません。(しかし、それは私の見解です)。
2番目の質問は、一般的な方法で答えるのは少し奇妙に思えます。人口の半分以上の(たとえば)サンプルをいつ取得しますか?
より大きな問題はバイアスです。米国国勢調査に戻ると、問題は単に人を逃していることではなく、逃した人が総人口のランダムなサンプルではないことです。したがって、国勢調査がすべての人々の95%(数字を選ぶ)から回答を得たとしても、残りの5%がまったく異なる場合、結果はバイアスされます。
12人の委員のうち2人だけが女性であるとします。
または、委員会に女性が選ばれる確率の推定値と見なすこともできます。これは、選択プロセスの特性です。信頼区間を配置したり、それが半分(または別の関連する帰無仮説)と大幅に異なるかどうかをテストしたりすることができます。おそらく、プロセスを公平にするためにプロセスを変更する必要があります。
説明と推論の2つの見解は矛盾していませんが、まったく異なります。
2番目の質問に対する答えは、たとえ1人の個人がサンプリングされていない場合でも、母集団パラメーターに関する仮説の検定と検定の信頼区間を計算することには意味があるということです。CIとテストでは、サンプリングされる母集団のかなりの割合を考慮する必要があることに注意してください。有限母集団の修正を参照してください。