(SLRの場合を除き)非ベイジアン予測推論は比較的最近の分野です。「非ベイジアン」という見出しの下で、「古典的」頻度主義者に対するアプローチと「可能性」ベースのアプローチに細分化することができます。
古典的な周波数主義者の予測
ご存じのように、頻繁な「ゴールドスタンダード」は、サンプリングを繰り返しても公称カバレッジを達成することです。たとえば、95%の信頼領域に、同じ基礎母集団のサンプルの95%に真のパラメーターを含める必要があります。または、平均でおよび等しい仮説検定でタイプIおよびIIのエラーをコミットすることが予想されます。最後に、この質問と最も密接な関係があるのは、95%の予測間隔に95%の時間で次のサンプルポイントが含まれることです。βαβ
今では、ほとんどの統計コースで古典的なPIがどのように提示され、教えられているかという問題が一般的にあります。圧倒的な傾向は、これらをベイジアン事後予測間隔として解釈することです。最も基本的に、彼らは異なる確率について話している!ベイジアンは、その量の繰り返しサンプリング性能については主張していません(そうでなければ、彼らは頻繁にいるでしょう)。第二に、ベイジアンPIは、実際には、クラシカル予測インターバルよりもクラシカルトレランスインターバルに近い精神で何かを達成しています。
参考:許容範囲は、信頼度とカバレッジの2つの確率で指定する必要があります。自信は、繰り返されるサンプルでどれくらいの頻度で正しいかを教えてくれます。カバレッジは、真の分布の下での間隔の最小 確率測度を示します(PIは、繰り返しサンプリングの下で期待される確率測度を繰り返します)。これは基本的に、ベイジアンPIが試みていることですが、サンプリングの繰り返しの主張はありません。
したがって、Stats 101 Simple Linear Regressionの基本的なロジックは、正規性の仮定の下でPIの繰り返しサンプリングプロパティを導出することです。通常は「古典的」と考えられ、イントロの統計クラスで教えられる頻度主義者とガウスのアプローチ。これは、結果の計算の単純さに基づいています(概要については、Wikipediaを参照してください)。
非ガウス確率分布は、間隔を取得するためにきちんと反転できる重要な量を欠く可能性があるため、一般に問題があります。したがって、これらの分布には「正確な」方法はありません。これは、多くの場合、間隔のプロパティが真の基礎となるパラメーターに依存するためです。
この無能さを認識して、尤度アプローチで別のクラスの予測(および推論と推定)が発生しました。
尤度ベースの推論
多くの現代の統計概念のように、尤度ベースのアプローチはロナルドフィッシャーにまでさかのぼることができます。この学校の基本的な考え方は、特別な場合を除き、統計的推論は、正確な確率ステートメントを作成できる正規分布(パラメーター推定値が直交)からの推論を処理する場合よりも論理的に弱いということです。この推論の見方では、正確な場合を除き、確率に関する記述を実際に避ける必要があります。そうでない場合は、尤度に関する記述を行い、エラーの正確な確率を知らないことを確認する必要があります(頻繁な意味で)。
したがって、尤度はベイジアン確率に似ていますが、積分可能性の要件や、頻度論的確率との混乱の可能性はありません。その解釈は完全に主観的です...しかし、0.15の尤度比はしばしば単一パラメータの推論に推奨されます。
ただし、「尤度間隔」を明示的に示す論文はあまり見られません。どうして?私たちは皆、確率ベースの信頼性ステートメントに慣れてきたため、これは主に社会学の問題であると思われます。代わりに、よく見られるのは、そのようなものの「近似」または「漸近的」信頼区間に言及している著者です。これらの間隔は、サンプル平均の漸近正規性に依存するのとほぼ同じ方法で、尤度比の漸近カイ二乗分布に依存している尤度法から大部分が導出されます。
この「修正」により、ベイジアンとほぼ同じ論理的一貫性を持つ「近似」95%信頼領域を構築できるようになりました。
Likelihood FrameworkでのCIからPIへ
上記の可能性アプローチの成功と容易さにより、予測にそれを拡張する方法についてのアイデアが生まれました。これに関する非常に素晴らしい調査記事がここにあります(その優れた報道を再現しません)。この用語は、1970年代後半にデビッドヒンクリー(JSTORを参照)にまでさかのぼることができます。彼はそれを多年生の「ピアソンの二項予測問題」に適用しました。基本的なロジックを要約します。
yyy
予測尤度を取得するために「迷惑」パラメータを取り除くための基本的なルールは次のとおりです。
- μ 、σ
- パラメーターがランダムな場合(たとえば、他の観測されていないデータまたは「ランダム効果」)、それらを統合します(ベイジアンアプローチの場合と同様)。
固定パラメーターとランダムパラメーターの区別は尤度推論に固有ですが、混合効果モデルへの接続があり、ベイジアン、頻度、および尤度のフレームワークが衝突するようです。
うまくいけば、これが「非ベイジアン」予測の広い領域(およびその問題の推論)に関するあなたの質問に答えたことを願っています。ハイパーリンクは変更される可能性があるため、「In Like Likelihood:Statistics Modeling and Inference using Likelihood」という本のプラグインも作成します。推論と予測。
参照資料
- 予測間隔:ノンパラメトリック法。ウィキペディア。2015年9月13日アクセス。
- Bjornstad、Jan F. 予測可能性:レビュー。統計学者。科学 5(1990)、いいえ。2、242--254。doi:10.1214 / ss / 1177012175。
http://projecteuclid.org/euclid.ss/1177012175。
- デビッド・ヒンクリー。予測尤度。統計年報集。7、No。4(1979年7月)、pp。718-728発行者:Institute of Mathematical Statistics Stable URL:http ://www.jstor.org/stable/2958920
- ユディ・パウィタン。すべての可能性:可能性を使用した統計モデリングと推論。 オックスフォード大学出版局; 1版(2001年8月30日)。ISBN-10:0198507658、ISBN-13:978-0198507659。特に5.5〜5.9、10、および16章。