私はこのサイトでブートストラップと信頼区間に関する多くの質問を見てきましたが、私はまだ混乱しています。混乱の原因の1つは、多くの答えを理解できるほど統計知識が十分に進歩していないことでしょう。私は入門的な統計コースのほぼ半分で、数学のレベルは中世代数II程度であるため、そのレベルを超えると混乱を招きます。このサイトの知識のある人が私のレベルでこの問題を説明できれば、非常に役立ちます。
クラスでは、ブートストラップメソッドを使用してリサンプルを取得し、それらを使用して、測定する統計の信頼区間を構築する方法を学習していました。したがって、たとえば、大規模な母集団からサンプルを取得し、40%が候補者Aに投票すると答えたとします。このサンプルは元の母集団をかなり正確に反映していると仮定します。人口について何かを発見するために。したがって、リサンプルを取得し、(95%の信頼レベルを使用して)結果の信頼区間が35%から45%の範囲であることを見つけます。
私の質問は、この信頼区間は実際にはどういう意味ですか?
(Frequentist)Confidence Intervalsと(Bayesian)Credible Intervalsには違いがあることを読み続けます。正しく理解すれば、信頼できる間隔は、私たちの状況では真のパラメーターが指定された間隔(35%-45%)内にある95%の可能性があると言い、信頼区間はこれに 95%あると言います状況のタイプ(ただし、必ずしも特定の状況である必要はありません)使用しているメソッドは、真のパラメーターが指定された間隔内にあることを正確に報告します。
この定義が正しいと仮定すると、私の質問は次のとおりです。ブートストラップメソッドを使用して構築された信頼区間を使用する場合に話している「真のパラメーター」とは何ですか。(a)元の母集団の真のパラメーター、または(b)サンプルの真のパラメーターを参照していますか?(a)の場合、95%の確率で、ブートストラップメソッドは元の母集団に関する真のステートメントを正確に報告します。しかし、どうしてそれを知ることができるのでしょうか?ブートストラップ方法全体が仮定に基づいていないか元のサンプルは、それが取られた母集団の正確な反映であると?(b)の場合、信頼区間の意味がまったくわかりません。サンプルの真のパラメーターは既にわかっていませんか?それは簡単な測定です!
私はこれを先生と話しましたが、彼女はとても役に立ちました。しかし、私はまだ混乱しています。