信頼区間と予測区間の解釈に関するサイト上の多くの優れた議論を読みましたが、1つの概念はまだ少し不可解です:
OLSフレームワークを考えてみると、近似モデルが得られました。が与えられ、その応答を予測するように求められます。私たちは、計算のx ^ {* T} \帽子\ベータ版をボーナスとして、我々はまた、私たちの予測を中心に95%予測区間を提供し、そして、ラ・線形モデルで予測制限の式を得ます。この予測間隔をPIと呼びましょう。
さて、PIの正しい解釈は次のうちどれですか(どちらでもありません)?
- 用特に、、95%の確率でPI内にあります。
- 多数のxが与えられた場合、PIを計算するこの手順は、95%の時間で真の応答をカバーします。
線形回帰予測間隔の @gungの文言から、前者は正しいように思えます(非常によく誤解される可能性があります)。それが正しいかどう私たちがしているので、それは予測の実現確率変数の対推定パラメータを?
(編集)ボーナスの質問:真のが何であるか、つまりデータを生成するプロセスを知っていると仮定すると、見ているだけで、特定の予測に関する確率について話すことができるでしょうか?
これに対する私の最新の試み:(概念的に非常に大まかに言って)予測区間を2つの部分に分解できます。エラー項の範囲。(B)真の予測平均を知っていることを条件に、確率的ステートメントを作成できますが、全体として、予測間隔は、予測値の周りの頻度CIとしてのみ扱うことができます。これはいくらか正しいですか?