タグ付けされた質問 「coverage-probability」

2
正規化された推定による信頼区間のカバレッジ
何らかの正規化された推定を使用して、高次元のデータから多数のパラメーターを推定しようとしているとします。レギュラライザーは推定値にある程度のバイアスを導入しますが、分散の減少はそれを補う以上のものでなければならないため、依然として良いトレードオフになる可能性があります。 問題は、信頼区間を推定するときに発生します(たとえば、ラプラス近似またはブートストラップを使用)。具体的には、推定値の偏りにより、信頼区間のカバレッジが悪くなり、推定量の頻度特性を判断することが難しくなります。 この問題について議論している論文をいくつか見つけました(例:「エッジワース展開に基づくリッジ回帰の漸近信頼区間」)が、数学はほとんど私の頭の上にあります。リンクされた論文では、方程式92-93がリッジ回帰によって正則化された推定値の補正係数を提供しているように見えますが、さまざまな正則化器で機能する適切な手順があるかどうか疑問に思っていました。 一次補正でさえ非常に役立ちます。

3
確率の収束について
ましょう{Xn}n≥1{Xn}n≥1\{X_n\}_{n\geq 1}ランダム変数STの配列であるXn→aXn→aX_n \to a確率で&gt; 0は固定された定数です。私は次を見せようとしています: √a&gt;0a&gt;0a>0Xn−−−√→a−−√Xn→a\sqrt{X_n} \to \sqrt{a} と aXn→1aXn→1\frac{a}{X_n}\to 1 両方の確率。私の論理が健全かどうかを確認するためにここにいます これが私の仕事です 試行 最初の部分については、我々は持っています |Xn−−−√−a−−√|&lt;ϵ⟸|Xn−a|&lt;ϵ|Xn−−−√+a−−√|=ϵ|(Xn−−−√−sqrta)+2a−−√||Xn−a|&lt;ϵ⟸|Xn−a|&lt;ϵ|Xn+a|=ϵ|(Xn−sqrta)+2a||\sqrt{X_n}-\sqrt{a}|<\epsilon \impliedby |X_n-a|<\epsilon|\sqrt{X_n}+\sqrt{a}|=\epsilon|(\sqrt{X_n}-sqrt{a})+2\sqrt{a}| ≤ϵ|Xn−−−√−a−−√|+2ϵa−−√&lt;ϵ2+2ϵa−−√≤ϵ|Xn−a|+2ϵa&lt;ϵ2+2ϵa\leq \epsilon|\sqrt{X_n}-\sqrt{a}|+2\epsilon\sqrt{a}<\epsilon^2+2\epsilon\sqrt{a} お知らせ ϵ2+2ϵa−−√&gt;ϵa−−√ϵ2+2ϵa&gt;ϵa\epsilon^2+2\epsilon\sqrt{a}>\epsilon\sqrt{a} その後、 P(|Xn−−−√−a−−√|≤ϵ)≥P(|Xn−a|≤ϵa−−√)→1asn→∞P(|Xn−a|≤ϵ)≥P(|Xn−a|≤ϵa)→1asn→∞P(|\sqrt{X_n}-\sqrt{a}|\leq \epsilon)\geq P(|X_n-a|\leq \epsilon\sqrt{a})\to 1 \;\;as\;n\to\infty ⟹Xn−−−√→a−−√inprobability⟹Xn→ainprobability\implies \sqrt{X_n}\to\sqrt{a} \;\;in\;probability 第二部については、 |aXn−1|=|Xn−aXn|&lt;ϵ⟸|Xn−a|&lt;ϵ|Xn||aXn−1|=|Xn−aXn|&lt;ϵ⟸|Xn−a|&lt;ϵ|Xn||\frac{a}{X_n}-1|=|\frac{X_n-a}{X_n}|<\epsilon \impliedby |X_n-a|<\epsilon|X_n| ここで、Xn→aXn→aX_n \to a asn→∞n→∞n \to \infty、XnXnX_nは有界シーケンスです。つまり、実数が存在するM&lt;∞M&lt;∞M<\infty STは|Xn|≤M|Xn|≤M|X_n|\leq M。したがって、 確率で見ると、 P (| a|Xn−a|&lt;ϵ|Xn|⟸|Xn−a|&lt;ϵM|Xn−a|&lt;ϵ|Xn|⟸|Xn−a|&lt;ϵM|X_n-a|<\epsilon|X_n|\impliedby |X_n-a|<\epsilon MP(|aXn−1|&gt;ϵ)=P(|Xn−a|&gt;ϵ|Xn|)≤P(|Xn−a|&gt;ϵM)→0asn→∞P(|aXn−1|&gt;ϵ)=P(|Xn−a|&gt;ϵ|Xn|)≤P(|Xn−a|&gt;ϵM)→0asn→∞P(|\frac{a}{X_n}-1|>\epsilon)=P(|X_n-a|>\epsilon|X_n|)\leq …

3
「実際のカバレッジ確率」の計算は、「信頼できる間隔」の計算と同じですか?
エントリーレベルの統計教科書を読んでいました。二項分布を持つデータの成功率の最尤推定に関する章では、信頼区間を計算するための式を提供し、さりげなく言及しました 実際のカバレッジ確率、つまり、メソッドが真のパラメーター値を取得する間隔を生成する確率を考慮してください。これは、公称値よりもかなり少ない場合があります。 そして、おそらく実際のカバレッジ確率を含む代替の「信頼区間」を構築する提案を続けます。 私は初めて、名目確率と実際のカバレッジ確率の考えに直面しました。ここで古い質問を通り抜けると、理解できたと思います。確率と呼ばれる2つの異なる概念があります。1つ目は、まだ起こっていないイベントが特定の結果を生成する確率であり、2つ目は確率です。既に発生したイベントの結果に対する監視エージェントの推測が真である可能性がどのくらいあるかです。また、信頼区間は最初のタイプの確率のみを測定し、「信頼できる区間」と呼ばれるものは2番目のタイプの確率を測定するように見えました。要約すると、信頼区間は「公称カバレッジ確率」を計算するものであり、信頼区間は「実際のカバレッジ確率」をカバーするものであると仮定しました。 しかし、本を誤って解釈した可能性があります(それが提供する異なる計算方法が信頼区間と信頼区間、または2つの異なるタイプの信頼区間に対するものであるかどうかは完全に明確ではありません)。私の現在の理解。特に私が別の質問で得たコメント、 頻度主義者の信頼区間、ベイジアンにとって信頼できる その本はその章でベイジアン法を説明していなかったので、私は私の結論を疑いました。 ですから、私の理解が正しいかどうか、または途中で論理的な誤りを犯したかどうかを明確にしてください。
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.