何かが頻度の高い特性を持つとはどういう意味ですか?


12

私はこのフレーズをよく耳にしましたが、その意味を完全に理解したことはありません。「良好なフリークエンシストプロパティ」というフレーズには、現在googleで2750ヒット、scholar.google.comで536ヒット、stats.stackexchange.com4ヒットがあります。

私が明確な定義に最も近いものは、このスタンフォード大学のプレゼンテーションの最後のスライドから来ています。

95%の信頼区間を報告するという意味は、さまざまな推定問題があったとしても、主張の95%の真のパラメーターを「トラップ」することです。これは、頻度の高い特性を備えた推定手順の特徴的な特性です。繰り返し使用した場合、それらは精査に耐えます。

これについて少し考えてみると、「良好な周波数主義者の特性」というフレーズは、ベイズ法、特に区間構築のベイズ法の評価を暗示していると思います。ベイズの区間は、確率パラメーターの真の値を含むことを意図していることを理解しています。頻繁な間隔は、間隔構築のプロセスがp 100 について何度も繰り返される場合に、pp100間隔のうち、パラメータの真の値が含まれます。ベイジアン間隔は、一般に、間隔の何%がパラメータの真の値をカバーするかについての約束をしません。ただし、一部のベイジアンメソッドには、何度も繰り返されると、の時間に関する真の値をカバーするという特性もあります。彼らがその特性を持っているとき、彼らは「良い周波数主義者の特性」を持っていると言います。p100

そうですか?フレーズは、良い周波数特性を持っているのではなく、良い周波数特性を指しているので、それ以上のものがあるに違いないと思います


1
この質問に対するあなたの考えがとても気に入っています。初期の頃、ハロルド・ジェフリーズirは、尤度関数のように振る舞い、それゆえに良好な頻度特性をもつベイジアン事後分布を構築しようとしました。したがって、「均一な」事前分布を構築することになります。そのような事前分布を使用すると、事前分布が中立であり、推論に影響を与えないという意味です。したがって、これは単に信頼区間を信頼区間のように見せること以上のものに当てはまります。しかし、ジェフリーズは、「均一な」事前分布が適切でない場合があったため、いくつかの問題に遭遇しました。
マイケルR.チェルニック

1
不適切とは、以前の密度が1に統合されないことを意味します。ジェフリーズは、ベイジアン法を、頻度主義法に同意することによって正当化する必要があると考えているようです。ベイジアンは最終的にこの概念を拒否しました。なぜなら、彼らが主張するアプローチの価値は、推論に影響を与える事前情報があるため、適切な「有益な」事前情報を使用することを好むからです。
マイケルR.チャーニック

2
@MichaelChernick:ジェフリーズがベイズ推定量の頻繁な特性を求めていることについて正確なリファレンスを提供できますか?私はこの話を聞いたことがありません。そして、私はまた、ジェフリーズは、不適切な事前分布を使用して心配すべてにあった疑い、彼らはすべてを超えている確率論
西安

私はLOVEこの質問を!
アレクシス

1
実際、@ Xi'anは、ベータ二項モデルでは、ジェフリーズ事前確率(この場合は適切)ではなく、Haldane事前確率(不適切)であり、頻度の高い推定値につながるものです。ジェフリーズが優れた周波数特性を探していることも聞いたことがありません。客観的な優先順位を探していると思い、客観的には再パラメータ化の下で不変であることを意味しました。
DeltaIV 16

回答:


3

頻度の高いプロパティの扱いにくい点は、特定の結果や推論のプロパティではなく、プロシージャのプロパティであることです。頻度の高い手順では、長期的には指定された割合のケースで正しい推論が得られますが、多くの場合、問題の個々のケースで正しいベイジアン手順が正しい推論をもたらします。

たとえば、エビデンス(尤度関数)と事前確率分布の組み合わせを正しく表す事後確率分布または信頼区間を提供するため、一般的な意味で「良好」なベイジアンプロシージャを考えます。事前情報に正確な情報が含まれている場合(たとえば、空の意見や何らかの情報のない事前情報ではなく)、その事後または間隔は、同じデータからの頻繁な結果よりも良い推論になる可能性があります。この手順は、正確な情報を含むカスタマイズされた事前情報を利用するため、この特定のケースに関するより正確な推論またはより狭い推定間隔につながるという意味で優れています。長期的には、間隔のカバレッジ率と推論の正確性は、各事前確率の品質に影響されます。

この手順では事前分布の取得方法が指定されていないため、パフォーマンスの長期的なアカウンティングでは、各ケースのカスタム設計事前分布ではなく、任意の古い事前分布が想定されることに注意してください。

ベイジアンプロシージャに、良好な頻度特性があります。たとえば、多くの場合、レシピが提供する有益ではない事前分布を使用したベイジアン手順は、かなりの頻度から優れた頻度の特性を持ちます。これらの優れた特性は、設計上の特徴というよりは偶然であり、そのような手順が頻繁な手順と同様の間隔をもたらす単純な結果になります。

したがって、ベイジアン手法は、個々の実験で優れた推論特性を持ち、長期的には頻度の低い特性を持ちます。同様に、長期にわたる周波数特性が良好な周波数特性の手順では、個々の実験のパフォーマンスが低下することがよくあります。


2
従わない 経験的ベイズを除き、私が見たすべてのベイジアン手順では、データとは無関係に事前が選択されています。したがって、このような手順を同じデータ生成プロセス(これは頻度の高いフレームワーク)からの複数のデータセットに適用する場合、ベイジアンは同じ尤度関数(データ生成プロセスは同じ)同じ事前(事前はほとんどのベイズ手順のデータとは無関係)。もちろん、データは毎回変わるため、尤度のは変わりますが、その形式は同じです。ここで、各個人が[1/2]
DeltaIV

2
[2/2]見積もりはより正確ですが、手順全体の精度を下げるにはどうすればよいですか?これは、ベイジアン推定値が常により正確ではない場合にのみ可能です。ただし、事前データは観測データに合わせてカスタマイズされていないため、個々のケースおよび/または「平均的」に正確性が多少向上する理由はわかりません。
DeltaIV 16

@DeltaVあなたは間違った参照セットを扱っていると思います。プロシージャの頻繁なプロパティは、特定の実験の繰り返しだけでなく、すべての新しいケースに適用されるプロシージャの長期実行パフォーマンスに関連しています。そのため、二項比率の信頼区間手順は、手順が使用される特定のインスタンスに関連する値だけでなく、パラメーターのすべての値に対して機能する必要があります。そのタイプの「長期」とは、問題のケースに適したカスタマイズされた事前確率が長期に対して不適切であることを意味します。
マイケルルー

あなたは、頻繁な信頼の手順が未知のパラメーターのすべての値に対して名目上のカバレッジを持たなければならないことは正しいです。これは、Newman&Pearsonによって明確に指定されており、今日見過ごされがちです。ただし、事前値を選択した場合、どちらがパラメーターの「true」値であるかはわかりません。サンプルのみがあり、事前分布はサンプルから独立している必要があります。したがって、サンプルに基づいて事前設定をどのようにカスタマイズできるかはまだはっきりとわかりません。実用的な例を作れますか?
DeltaIV 16

@DeltaIV前回の調査で現在の関心のあるパラメーターが推定されていることがわかっている場合、その推定に基づいて有益な事前分布を形成できます。この事前分析はこの現在の分析に適していますが、長期的にはメソッドの概念的なアプリケーションのセットに利用できる同等の適切な情報的事前分析はありません。したがって、分析は、隔離された実際のケースでは、頻繁な長期的に見られるよりもはるかに優れた特性を持つことができます。
マイケルルー

2

あなたの分析は正しいと答えます。さらにいくつかの洞察を提供するために、一致する事前分布について言及します。

一致する事前分布は、通常、頻度の高いプロパティを持つベイジアンモデルを構築するために設計された事前分布です。特に、取得されたhpd間隔が信頼区間の頻度範囲を満足するように定義されます(したがって、95%hpdの95%が長期的に真の値を含むようになります)。1dには分析的な解決策があることに注意してください。ジェフリーズの事前分布は一致する事前分布です。より高い次元では、これは事実ではありません(私の知る限り、これが真実ではないことを証明する結果はありません)。

実際には、このマッチングの原則は、モデルの一部のパラメーターの値を調整するためにも適用される場合があります:グラウンドトゥルースデータは、それらの値が目的のパラメーターの結果の信頼できる間隔の頻度範囲を最大化するという意味でこれらのパラメーターを最適化するために使用されます。私自身の経験から、これは非常に微妙な作業かもしれません。


0

貢献できることがあれば、まず説明を追加してから、質問に直接答えてください。トピック(ベイジアン手順の要求者の特性)について多くの混乱があり、専門家の間で意見の相違さえあります。最初の誤解は、「ベイジアン間隔は、確率のあるパラメーターの真の値を含むことを意味しますp純粋なベイジアン(ベイジアンプロシージャを評価するためにフリークエンシー主義の概念を採用していないもの)の場合、「真のパラメーター」のようなものはありません。ベイジアンの世界では、ベイジアンとして、パラメータの真の値を回復するのではなく、「パラメータ」またはそのモーメントの分布を回復します。

さて、あなたの質問に答えるために:いいえ、それはベイジアン法の評価を意味しません。ニュアンスをスキップし、推定手順に焦点を当ててシンプルにする:統計の頻度は、未知の固定量を推定するか、仮説をテストし、そのような手順を仮想の繰り返しに対して評価するという考え方です。手順を評価するために多くの基準を採用できます。頻繁な基準となるのは、同じ手順を何度も繰り返し採用する場合に何が起こるかを気にすることです。そうする場合、あなたは頻繁な特性を気にします。言い換えると、「頻度の高い特性は何ですか?」「手順を何度も繰り返すとどうなりますか?」さて、このような頻繁な特性を良くするもの基準の別のレイヤーです。良好な特性と見なされる最も一般的な周波数特性は一貫性です(推定では、推定値をサンプリングし続けると、推定する固定値に収束します)、効率サンプリングし続けると(サンプリングを続けるとの分散はゼロになります) 、より正確になります)、カバレッジ確率(手順を何度も繰り返すと、95%の信頼区間には95%の時間の真の値が含まれます)。最初の2つは大規模サンプルプロパティと呼ばれ、3つ目は必ずしも漸近的な結果を使用する必要がないという意味で、Neymanの正規頻度プロパティです。要するに、頻度主義の枠組みには、真の未知の価値があります。あなたはそれを推定し、あなたは常に(まれな幸運な事故を除いて)推定に間違いがありますが、あなたは少なくともあなたの推定を仮説的に無期限に繰り返すことで、あなたがますます間違っていないかある程度の時間は正しいことを知っています。それが理にかなっているかどうか、またはあなたの質問ではないことを考えると、それを正当化するために必要な追加の仮定については議論しません。概念的には、それが頻繁なプロパティが参照するものであり、そのようなコンテキストでは一般的に良い意味です。

この論文を指し示すことで締めくくりますので、あなたがそれが理にかなっているかどうか、そしてベイジアン手順が良い周波数特性を持っていることを意味するかどうかをあなた自身で判断します(参照がもっとあります):

  • リトル、R。、その他(2011)。一般に統計用、特に欠落データ用の調整済みベイ。統計科学、26(2)、162–174。
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.