母集団全体のデータが利用できる場合、信頼区間を計算し、仮説をテストすることは理にかなっていますか？

母集団全体のデータが利用できる場合、信頼区間を計算し、仮説をテストすることは理にかなっていますか？私の意見では、パラメーターの真の値を正確に計算できるため、答えは「いいえ」です。しかし、それでは、前述の手法を使用できるようにする元の母集団からのデータの最大比率はどのくらいですか？

— ミロスラフ砂防
ソース

n = N

$n=N$

質問が「sample = population」の場合、または「有限母集団からのサンプル」の場合については、より明確に述べる必要があると思います。

— ttnphns 2013

質問の最初の部分は、sample = populationに関するもので、2番目は、populationからのサンプルに関するものです（サンプルサイズ<人口サイズの場合）。

— Miroslav Sabo 2013

密接に関連する質問：母集団全体を表すデータで有意性をテストしますか？と人口データが利用可能な場合のリソース

— Silverfish 2016

回答:

最初の質問は、一般的に合意されていない回答です。私自身の見解はあなたの見解と似ていますが、人口は「超人口」のサンプルと見なすことができ、超人口の正確な性質は状況によって異なると主張する人もいます。建物は、同様の建物に住んでいるすべての人々からのサンプルと見なすことができます。米国の人口調査（本当に完全であるとは限らない）は、ある日存在するかもしれないアメリカ人（またはそのようなもの）の超人口からのサンプルと見なすことができます。これは、p値を使用するための言い訳になることが多いと思います。実体分野の多くの科学者は、p値を取得していないと快適ではありません。（しかし、それは私の見解です）。

2番目の質問は、一般的な方法で答えるのは少し奇妙に思えます。人口の半分以上の（たとえば）サンプルをいつ取得しますか？

より大きな問題はバイアスです。米国国勢調査に戻ると、問題は単に人を逃していることではなく、逃した人が総人口のランダムなサンプルではないことです。したがって、国勢調査がすべての人々の95％（数字を選ぶ）から回答を得たとしても、残りの5％がまったく異なる場合、結果はバイアスされます。

— ピーターフロム-モニカの回復
ソース

母集団統計の信頼区間を計算するかどうかは、実際の母集団または仮想的な「超母集団」を推論するかどうかに依存すると思います。州保健局の過去の仕事で、出生時の非常に低い割合や自殺率などの年次統計を毎年報告しました。はい、私たちは人口全体について報告していましたが、人口の健康の完全な変化として、これらおよび他の健康指標のすべての増加または減少に州の健康の進歩（および資金提供！）を左右するのはばかげています。

— RobertF

12人の委員のうち2人だけが女性であるとします。

$\frac{1}{6}$

または、委員会に女性が選ばれる確率の推定値と見なすこともできます。これは、選択プロセスの特性です。信頼区間を配置したり、それが半分（または別の関連する帰無仮説）と大幅に異なるかどうかをテストしたりすることができます。おそらく、プロセスを公平にするためにプロセスを変更する必要があります。

説明と推論の2つの見解は矛盾していませんが、まったく異なります。

2番目の質問に対する答えは、たとえ1人の個人がサンプリングされていない場合でも、母集団パラメーターに関する仮説の検定と検定の信頼区間を計算することには意味があるということです。CIとテストでは、サンプリングされる母集団のかなりの割合を考慮する必要があることに注意してください。有限母集団の修正を参照してください。

— Scortchi-モニカの回復
ソース