1つの観測値の分散の信頼区間


25

これは、「確率論における第7回コルモゴロフ学生オリンピック」の問題です。

両方のパラメーターが不明な分布から1つの観測値与えられた場合、少なくとも99%の信頼レベルで信頼区間を与えます。XNormal(μ,σ2)σ2

私には、これは不可能であると思われます。解決策はありますが、まだ読んでいません。何かご意見は?

数日中にソリューションを投稿します。

[次の編集:以下に掲載されている公式ソリューション。Cardinalのソリューションはより長くなりますが、より良い信頼区間を提供します。また、入力してくれたMaxとGlen_bにも感謝します。]


1
私にとっても不可能のようです。私は答えを待っています
ピーター・フロム-モニカの復職

1
このサイトをチェックしてください。
想定

3
書式設定が改善された用紙は次のとおりです。paper
想定

へえ。私は何年も前にこのことに関する論文(1つの観察間隔)を読んだことを覚えています。されている可能性があり、この 1。
Glen_b -Reinstateモニカ

1
@マックス、リンクをありがとう!まだ詳しく見る時間はありませんが、そうします。以下に「公式」回答を掲載しました。
ジョナサンクリステンセン

回答:


17

確率の不等式と多重観測の事例との関係のレンズを通して見ると、この結果はそれほど不可能ではないように見えるかもしれませんし、少なくとも、もっともらしいと思われるかもしれません。

ましょうとおよび不明。に対してと書くことができます。μ σ 2 X = σ Z + μ Z N0 1 XN(μ,σ2)μσ2X=σZ+μZN(0,1)

主な主張:は、信頼区間です。ここで、は、1次のカイ二乗分布のレベルの分位数です。自由。さらに、この間隔は場合に正確にカバレッジを持つため、一部のに対して形式の可能な限り狭い間隔になります。1 - α σ 2 、Q α α 1 - α μ = 0 [ 0 B X 2B R[0,X2/qα)(1α)σ2qαα (1α)μ=0[0,bX2)bR

楽観的な理由

の場合、の典型的な信頼区間は であることを思い出してください ここでは、自由度のカイ2乗のレベルの分位数です。もちろん、これは当てはまります。これは最も一般的な間隔(明らかな理由から等間隔間隔と呼ばれます)ですが、唯一の間隔でも最小幅の間隔でもありません!明らかなように、別の有効な選択は T = Σ N I = 1X I - ˉ X21 - α σ 2 Tn2T=i=1n(XiX¯)2 (1α)σ2QのK k個のμ 0 T

(Tqn1,(1α)/2,Tqn1,α/2),
qk,aakμ
(0,Tqn1,α).

、以来、、次に 少なくともカバレッジもあります。 0 Σ N iが= 1 X 2 IをTi=1nXi21 - α

(0,i=1nXi2qn1,α),
(1α)

この観点から見ると、メインクレームの間隔がに対して真であると楽観的になるかもしれません。主な違いは、単一の観測値の場合、ゼロ自由度カイ2乗分布がないため、1自由度の分位数を使用することを期待する必要があります。n=1

目的地に向かって半歩右尾を活用

主な主張の証拠に飛び込む前に、まず、それほど強くないか、統計的に満足できる予備的な主張を見てみましょう。以下の主な申し立ての証拠までスキップできますが、損失はほとんどありません。このセクションと次のセクションでは、証明は(わずかに微妙ですが)基礎的な事実のみに基づいています。すなわち、確率の単調性、および正規分布の対称性と単峰性です。

補助クレーム:は、限り、信頼区間です。ここで、は標準法線のレベルの分位数です。1 - α σ 2 α > 1 / 2 Z α α[0,X2/zα2)(1α)σ2α>1/2zαα

証明。および対称性により、以下では一般性を失うことなくを取ることができます。ここで、および場合、 したがってでは、 これはに対してのみ機能します。これは必要なためです。| σ Z + μ | d = | - σ Z + μ | μ 0 θ 0 μ 0 P| X | > θ PX > θ = Pσ Z + μ > θ PZ|X|=|X||σZ+μ|=d|σZ+μ|μ0θ0μ0θ = Z α σ P0 σ 2 < X 2 / Z 2 α1 - α

P(|X|>θ)P(X>θ)=P(σZ+μ>θ)P(Z>θ/σ),
θ=zασα > 1 / 2 Z α > 0
P(0σ2<X2/zα2)1α.
α>1/2zα>0

これは、補助的な主張を証明しています。実例であるが、動作するのにとてつもなく大きなを必要とするため、統計的な観点からは不満である。α

主な主張の証明

上記の引数を改良すると、任意の信頼レベルで機能する結果が得られます。まず、であることに注意してください 設定する及び。次に、 固定ごとに 右側がで増加することを示すことができれば、前の引数と同様の引数を使用できます。平均が増加すると、を超えるモジュラスを持つ値が表示される可能性が高くなると信じたいため、これは少なくとももっともらしいです。A = μ / σ 0 、B = θ / σ 0 P| Z + | > B = Φ - B + Φ - - B

P(|X|>θ)=P(|Z+μ/σ|>θ/σ).
a=μ/σ0b=θ/σ0a b b
P(|Z+a|>b)=Φ(ab)+Φ(ab).
abb。(ただし、左テールで質量がどれだけ速く減少するかに注意する必要があります!)

セット。次に、 なおと正のための、で減少している。現在、場合、であることが簡単にわかります。これらの事実をまとめると 、すべてのおよび任意の固定についてを簡単に暗示し 。、F ' 、B= φ - B - φ - - B = φ - B - φ a + b fb(a)=Φ(ab)+Φ(ab)f b

fb(a)=φ(ab)φ(ab)=φ(ab)φ(a+b).
、U φ U U A 0 2 B φ - B φ - B = φ B F ' B0 、A 0 B 0fb(0)=0uφ(u)ua(0,2b)φ(ab)φ(b)=φ(b)
fb(a)0
a0b0

したがって、および、 、B 0 P| Z + | > B P| Z | > bが= 2 Φ - B a0b0

P(|Z+a|>b)P(|Z|>b)=2Φ(b).

このすべてを解き、をとると、を取得します 主な主張を確立します。PX2>Qασ2PZ2>Qα=1-αθ=qασ

P(X2>qασ2)P(Z2>qα)=1α,

最後に:上記の引数を注意深く読むと、正規分布の対称および単峰性のプロパティのみが使用されていることがわかります。したがって、このアプローチは、コーシー分布やラプラス分布など、対称的な単一モードの位置スケールファミリからの単一の観測から信頼区間を取得する場合にも同様に機能します。


うわー!学生はオリンピアード試験の短い時間でこの種の議論を思い付くことが期待されていますか?
ディリップサルワテ

1
@Dilip:わからない!私はこのオリンピアードの形式や、解決策に関して期待されるものに不慣れです。文字通りの読みから、Scortchiの答えは受け入れられると思います。「自明ではない」ソリューションでどこまで到達できるかを理解することにもっと興味がありました。私自身の(かなり最小限の)探索は、回答に記載されているのと同じ一連の思考を(1回の迂回で)行いました。より良い解決策が存在する可能性が非常に高いです。:
枢機inal

これは「公式」ソリューションよりもかなり長いですが、分散のより良い限界を与えるので、「正しい」答えとしてマークしています。以下に「公式」回答と、シミュレーション結果とディスカッションを掲載しました。ありがとう、@ cardinal!
ジョナサンクリステンセン

2
@ジョナサン:ありがとう。はい、証明をもっと簡潔にすることができました。ここの参加者の背景は幅広いため、多くの場合、余分な(またはおそらく過剰な)詳細にふける傾向があります。:
枢機

12

フォローアップの時間!ここに私が与えられた解決策があります:

の形式の信頼区間を作成します。ここで、は統計量です。定義により、これは、信頼レベルが少なくとも99%の信頼区間になり 分布 の密度は超えないことに注意してください。したがって、ごとにです。したがって、 プラグイン[0,T(X))T()

μRσ>0Pμσ2σ2>Tバツ<0.01。
Nμσ2 P|X|A/σ1/σ2πP|バツ|aa/σa0
tP|バツ|/σt=Pバツ2t2σ2=Pσ2バツ2/t2
t=0.01適切な統計はTバツ=10000バツ2

信頼区間(非常に広い)はシミュレーションでわずかに保守的であり、CVを数桁にわたって変化させたため、経験的なカバレッジ(100,000シミュレーション)は99.15%未満です。

比較のために、枢機confidenceの信頼区間もシミュレートしました。枢機の間隔はかなり狭いことに注意してください-99%の場合、提供されたソリューションのとは対照的に、彼は最大約になります。経験的カバー率は名目レベルであり、CVの桁数も大きい。したがって、彼の間隔は間違いなく勝ちます。6300バツ210000バツ2

Maxが投稿した論文を注意深く見る時間はありませんでしたが、それを見て、それに関するコメントを後で(つまり、1週間以内に)追加する予定です。その論文は、99%の信頼区間主張しています。これは、簡単なシミュレーションで、大きなCVの公称カバレッジよりもわずかに低い経験的カバレッジ(約98.85%)を持っています。04900バツ2


1
(+1)それは素晴らしい解決策です。表示方程式に代わりにが必要ですか?tt
枢機

2
さらに2つのポイント:議論を変更せずに、あなたのソリューションを私のものに非常に近づけることができます。主張できることに注意してください。その後、間隔は任意のに対してになります。私の答えでは、を使用すると、とられます。信頼レベルが高い(つまり、が小さい)ほど、メソッドは私と比較して近くなります(ただし、間隔は常に広くなります)。0P|バツ|a2a/σ2π02バツ2/πα2αα=0.01Tバツ6366.198バツ21/q0.016365.864α
枢機

1
第二に、私はその論文を見ていないが、が有効な99%信頼区間になる可能性があることを強く疑っている。実際、いくつかのについての形式のすべての信頼区間を考慮します。次に、場合、は1自由度のカイ2乗であるため、このインスタンスで選択できる最小のは。言い換えれば、私の答えで与えられた間隔は、記載された形式の可能な限り狭いものです。0 B X 2B μ = 0 X 2 / σ 2 B B = 1 / Q α04900バツ20bバツ2bμ=0バツ2/σ2bb=1/qα
枢機

1
(疑わしい)タイプミスを修正しました。また、pchisq(1/4900,1,lower.tail=F)Rリターン0.9886のために非常に近いシミュレーション結果に、間隔。04900バツ2
枢機

1
@cardinal、すべてのコメントをありがとう。あなたの変更は正しいと思いますが、元のソリューションにあったように入力しましたが、タイプミスがあると思います。
ジョナサンクリステンセン

5

おそらくCI。0


1
なぜ有限長の信頼区間を取得できないのかを説明しておくと役立つと思います。
想定される通常の

1
@Max私は十分に頭が良くありません-しかし、質問はそれを求めませんでした。
スコルチ-モニカの復職

4
+1。質問は、カバレッジが最小のCIを示しておらず、実際には、「99%以上の信頼レベルを持つ信頼区間」という奇妙な表現で受け入れられる可能性があることを示唆しています。
アリB.フリードマン
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.