0/10と0/20の比較


10

タスク達成率について議論するとき、20回の試行のうち0回が10回の試行のうち0回よりも「悪い」ことを示す方法はありますか?


1
あなたはen.wikipedia.org/wiki/Additive_smoothingを使用することを試みるかもしれませんが、固い証明よりむしろ手を振るでしょう
abukaj

どうしてそれが悪いのか分かりますか?たとえば、10回しか試行できなかった場合、それ以上試行するとスコアはどうなるかわかりません
Tim

4
おそらく、推定比率の信頼区間ですか?
mdewey 2017

5
これは私には理にかなった質問のようです。これは、議論できる完全に正常な直感に基づいており、問題に対処するための統計的な方法(ベイジアンなど)があります。私は開いたままにすることに投票します。
ガン-モニカの回復

1
@gungに同意します。これは良い質問です。
Alexis

回答:


3

ある試みが成功する確率がわかっているとします。この場合、10ケースのうち0ケースと20ケースのうち0ケースの確率を計算します。

ただし、この場合は逆になります。確率はわかりません。データがあり、確率を推定しようとします。

ケースが多ければ多いほど、結果をより確実にすることができます。コイン1枚をめくってコインが表になる場合、それが両頭であるかどうかはあまりわかりません。1000回投げたら全部頭になるとバランスが取れそうにない。

推定を行うときに証跡の数を考慮するために設計された方法があります。それらの1つは、@ abukajが上記についてコメントしている加法平滑化です。加法平滑化では、考慮に追加の擬似サンプルを追加します。今回のケースでは、代わりに証跡に2つ追加しました-1つは成功し、もう1つは失敗しました。

  • 最初のケースでは、平滑化された確率は =〜8.3%1+010+1+1112
  • 2番目のケースでは、 =〜4.5%になります。1+020+1+1122

加法平滑化は推定の1つの方法にすぎないことに注意してください。異なる方法で異なる結果が得られます。加法平滑化自体を使用しても、4つの疑似サンプルを追加すると、異なる結果が得られます。

別の方法は、@ mdeweyが示唆するように信頼区間を使用することです。サンプル数が多いほど、信頼区間は短くなります。信頼区間のサイズは、サンプルの平方根に比例します-。したがって、サンプル数を2倍にすると、信頼区間が短くなります。1n2

どちらの場合も平均は0です。信頼水準は90%(z = 1.645)です。

  • 最初のケースでは、0 +%を取得します1.64510
  • 2番目のケースでは、0 +〜36%を取得します1.64520

データが欠落している場合、不確実性があります。前提条件と使用する外部データによって、取得する内容が変わります。


1
ダン・レビンさん、ありがとうございました。あなたの答えは、非数学者が理解できるほど明確でしたが、私があなたの説明を直感的に受け入れるのに十分なほど強固でした。ご意見をいただき、ありがとうございます。
vinne 2017

1

信頼区間を呼び出すという考え方を拡張して、正確な二項区間の概念があります。

二項分布は、0(失敗)または1(成功)のいずれかで終わる独立した試験での成功の総数です。1(成功)を取得する確率は、伝統的にと表され、その補数はです。次に、標準的な確率結果は、回の試行で正確に成功する確率がpq=1pkn

pn,k=(nk)pkqnk=n!k!(nk)!pkqnk

信頼区間の概念は(ここでは、成功の確率モデルパラメータの可能な値のバインドセットにある我々は確率的(まあ、作ることができるように)frequentistすなわち、(真のパラメータ値がこの区間内にあるかどうかについての)文を、10回または20回の試行を行う確率的実験を繰り返し、指定された方法で信頼区間を作成すると、パラメーターの真の値が95%の時間内にあることがわかります)。p

この場合、その式でを解くことができます: p

pn,0=(1p)n

したがって、片側95%の間隔が必要な場合は、を設定して、観測されたゼロカウントが最大5%である確率を解決します。以下のために、答えは(各試行における成功の確率は13.9%である場合、すなわち、極端で、ゼロの成功を観察する確率は5%です)。以下のために、答えは。だから、サンプルから、我々はより多くのサンプルからより学んだ我々は``「」の範囲を除外することができるという意味で、のサンプルそのまだもっともらしい。pn,0=5%n=20[0%,13.9%]n=10[0%,25.9%]n=20n=10[13.9%,25.9%]n=10


0

ベイジアンアプローチ

  • してみましょうのために IIDの一連のことがベルヌーイ確率変数のパラメータを持つ。Xii=1,np
  • 私たちは、パラメータの不確定性を表すましょう、それは次の仮定することにより、ベータ分布ハイパーと。p αβ

尤度関数は、ベルヌーイであり、ベータ分布は、共役前ベルヌーイ分布のためには、従って事後はベータ分布に従います。さらに、事後は以下によってパラメーター化されます。

α^=α+i=1nXiβ^=β+ni=1nXi

結果として:

E[pX1,,Xn]=α^α^+β^=α+i=1nXiα+β+n

したがって、10回失敗した場合、期待値はであり、20回失敗した場合、期待値は。失敗が多いほど、に対する期待は低くなります。pαα+β+10pαα+β+20p

これは合理的な議論ですか?これは、ベイジアン統計についてどのように感じているか、確率の力学を使用してパラメーター不確実性をモデル化するかどうかに依存します。そして、それはあなたの前の選択がどれほど合理的であるかによる。p

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.