比率の信頼区間を計算する方法は?
0と1の間の比率を出力する実験を考えてみましょうXiXiX_i。この比率がどのように取得されるかは、このコンテキストでは関係ありません。それはこの質問の前のバージョンで詳しく説明されましたが、メタに関する議論の後に明確にするために取り除かれました。 この実験は回繰り返されますが、nは小さい(約3〜10)。Xは、私が独立同一分布すると仮定されます。これらから、我々は平均算出して平均値を推定¯ Xが、どのように対応する信頼区間計算するには、[ U 、Vを]?nnnnnnXiXiX_iX¯¯¯¯X¯\overline X[U,V][U,V][U,V] 信頼区間を計算するための標準的なアプローチを使用する場合、は1より大きい場合があります。しかし、私の直感では、正しい信頼区間は...VVV ... 0〜1の範囲内である必要があります ... nを増やすと小さくなりますnnn ...はおおよそ標準的なアプローチを使用して計算されたものの順です ...数学的に適切な方法で計算されます これらは絶対的な要件ではありませんが、少なくとも私の直感が間違っている理由を理解したいと思います。 既存の回答に基づいた計算 以下では、既存の回答から得られた信頼区間のために比較される。{Xi}={0.985,0.986,0.935,0.890,0.999}{Xi}={0.985,0.986,0.935,0.890,0.999}\{X_i\} = \{0.985,0.986,0.935,0.890,0.999\} 標準アプローチ(別名「学校数学」) 、σ2=0.0204は、従って、99%信頼区間である[0.865、1.053]。これは直感1と矛盾します。X¯¯¯¯=0.959X¯=0.959\overline X = 0.959σ2=0.0204σ2=0.0204\sigma^2 = 0.0204[0.865,1.053][0.865,1.053][0.865,1.053] 切り取り(コメントで@soakleyが提案) ただ、提供その後、標準的なアプローチを使用して結果としては、やることは容易です。しかし、それを行うことは許可されていますか?下限が一定のままであるとはまだ確信していません(-> 4)[0.865,1.000][0.865,1.000][0.865,1.000] ロジスティック回帰モデル(@Rose Hartmanにより提案) 変換されたデータ: で得られた[ 0.173 、7.87 ]、で結果をバック変換[ 0.543 、0.999を]。明らかに、6.90は変換されたデータの外れ値であり、0.99は変換されていないデータの外れ値であり、非常に大きな信頼区間になります。(-> 3.){4.18,4.25,2.09,2.66,6.90}{4.18,4.25,2.09,2.66,6.90}\{4.18,4.25,2.09,2.66,6.90\}[0.173,7.87][0.173,7.87][0.173,7.87][0.543,0.999][0.543,0.999][0.543,0.999] 二項比例信頼区間(@Timで推奨) アプローチは非常に良いように見えますが、残念ながら実験には適合しません。結果を組み合わせて、@ ZahavaKorで示唆されているように、ベルヌーイの大規模な繰り返し実験として解釈すると、次のようになります。 5のうち 4795 *合計 1000 これをAdjにフィードします。ワルドの計算はできます [ 0.9511 、0.9657 ]。単一の …