0と1の間の比率を出力する実験を考えてみましょう。この比率がどのように取得されるかは、このコンテキストでは関係ありません。それはこの質問の前のバージョンで詳しく説明されましたが、メタに関する議論の後に明確にするために取り除かれました。
この実験は回繰り返されますが、nは小さい(約3〜10)。Xは、私が独立同一分布すると仮定されます。これらから、我々は平均算出して平均値を推定¯ Xが、どのように対応する信頼区間計算するには、[ U 、Vを]?
信頼区間を計算するための標準的なアプローチを使用する場合、は1より大きい場合があります。しかし、私の直感では、正しい信頼区間は...
- ... 0〜1の範囲内である必要があります
- ... nを増やすと小さくなります
- ...はおおよそ標準的なアプローチを使用して計算されたものの順です
- ...数学的に適切な方法で計算されます
これらは絶対的な要件ではありませんが、少なくとも私の直感が間違っている理由を理解したいと思います。
既存の回答に基づいた計算
以下では、既存の回答から得られた信頼区間のために比較される。
標準アプローチ(別名「学校数学」)
、σ2=0.0204は、従って、99%信頼区間である[0.865、1.053]。これは直感1と矛盾します。
切り取り(コメントで@soakleyが提案)
ただ、提供その後、標準的なアプローチを使用して結果としては、やることは容易です。しかし、それを行うことは許可されていますか?下限が一定のままであるとはまだ確信していません(-> 4)
ロジスティック回帰モデル(@Rose Hartmanにより提案)
変換されたデータ: で得られた[ 0.173 、7.87 ]、で結果をバック変換[ 0.543 、0.999を]。明らかに、6.90は変換されたデータの外れ値であり、0.99は変換されていないデータの外れ値であり、非常に大きな信頼区間になります。(-> 3.)
二項比例信頼区間(@Timで推奨)
アプローチは非常に良いように見えますが、残念ながら実験には適合しません。結果を組み合わせて、@ ZahavaKorで示唆されているように、ベルヌーイの大規模な繰り返し実験として解釈すると、次のようになります。
5のうち 4795 *合計 1000 これをAdjにフィードします。ワルドの計算はできます [ 0.9511 、0.9657 ]。単一の X iがその間隔内にないため、これは現実的ではないようです!(-> 3.)
ブートストラップ(@soakleyが推奨)
では私たちは、3125個の可能な順列を持っています。3093を取る順列の真ん中の手段、我々が得る[0.91、0.99]。それほど悪くはないように見えますが、もっと長い間隔(-> 3)を期待しています。ただし、それは構造ごとではなく、。したがって、小さなサンプルの場合、 nを増やすと縮小するよりも大きくなります(-> 2.)。これは、少なくとも上記のサンプルで発生することです。