タスク達成率について議論するとき、20回の試行のうち0回が10回の試行のうち0回よりも「悪い」ことを示す方法はありますか?
タスク達成率について議論するとき、20回の試行のうち0回が10回の試行のうち0回よりも「悪い」ことを示す方法はありますか?
回答:
ある試みが成功する確率がわかっているとします。この場合、10ケースのうち0ケースと20ケースのうち0ケースの確率を計算します。
ただし、この場合は逆になります。確率はわかりません。データがあり、確率を推定しようとします。
ケースが多ければ多いほど、結果をより確実にすることができます。コイン1枚をめくってコインが表になる場合、それが両頭であるかどうかはあまりわかりません。1000回投げたら全部頭になるとバランスが取れそうにない。
推定を行うときに証跡の数を考慮するために設計された方法があります。それらの1つは、@ abukajが上記についてコメントしている加法平滑化です。加法平滑化では、考慮に追加の擬似サンプルを追加します。今回のケースでは、代わりに証跡に2つ追加しました-1つは成功し、もう1つは失敗しました。
加法平滑化は推定の1つの方法にすぎないことに注意してください。異なる方法で異なる結果が得られます。加法平滑化自体を使用しても、4つの疑似サンプルを追加すると、異なる結果が得られます。
別の方法は、@ mdeweyが示唆するように信頼区間を使用することです。サンプル数が多いほど、信頼区間は短くなります。信頼区間のサイズは、サンプルの平方根に比例します-。したがって、サンプル数を2倍にすると、信頼区間が短くなります。
どちらの場合も平均は0です。信頼水準は90%(z = 1.645)です。
データが欠落している場合、不確実性があります。前提条件と使用する外部データによって、取得する内容が変わります。
信頼区間を呼び出すという考え方を拡張して、正確な二項区間の概念があります。
二項分布は、0(失敗)または1(成功)のいずれかで終わる独立した試験での成功の総数です。1(成功)を取得する確率は、伝統的にと表され、その補数はです。次に、標準的な確率結果は、回の試行で正確に成功する確率が
信頼区間の概念は(ここでは、成功の確率モデルパラメータの可能な値のバインドセットにある我々は確率的(まあ、作ることができるように)frequentistすなわち、(真のパラメータ値がこの区間内にあるかどうかについての)文を、10回または20回の試行を行う確率的実験を繰り返し、指定された方法で信頼区間を作成すると、パラメーターの真の値が95%の時間内にあることがわかります)。
この場合、その式でを解くことができます:
したがって、片側95%の間隔が必要な場合は、を設定して、観測されたゼロカウントが最大5%である確率を解決します。以下のために、答えは(各試行における成功の確率は13.9%である場合、すなわち、極端で、ゼロの成功を観察する確率は5%です)。以下のために、答えは。だから、サンプルから、我々はより多くのサンプルからより学んだ我々は``「」の範囲を除外することができるという意味で、のサンプルそのまだもっともらしい。