Aが[8,10]で均一に分布し、[9,11]でBが均一に分布している場合、B <Aである確率はどれくらいですか?


7

この質問はインタビューで聞かれましたが、最初は正しく答えられませんでしたが、私の解釈は正しいと思われます。問題は:

AとBの2つの配送トラックがあります。Aは午前8時から10時の間に配達を行い、Bは午前9時から11時の間に配達を行います。配送は両方に均一に分配されます。Bからの特定の配信がAからの配信の前に行われる確率はどのくらいですか?

あなたの答えは何ですか、そしてなぜですか?

回答:


11

1/8です。下の図を参照してください。x軸にAの納期、y軸にBの納期が表示されています。配信は均一に分散されるため、正方形内のすべてのポイントが等しく発生する可能性があります。BはAの前に陰影を付けた領域でのみ配信します。これは合計の1/8です。

ここに画像の説明を入力してください

別の見方をすると、AがBの開始前に配信する可能性は50%であり、Aが完了した後にBが配信する可能性は50%です。つまり、片方または両方が発生する可能性は75%です。25%の確率で、両方が重複する時間に配信する場合、50-50の確率で最初に配信されます。


答え、特にグラフをありがとう、それが私が最終的に与えた答えです(「それについて考える別の方法を使用して」)。しかし、質問の仕方はBが行った旅行のみを参照しているので、実際には1/4であるように見えます。Bが行った100回の旅行ごとに、25時間はAの前に重なっているためです。つまり、BがトリップしなかったためにBが最初に到着する可能性がなかった部分がなぜカウントされるのでしょうか。私は質問を、Bの旅行について尋ねるだけだと読んだ。しかし、私の確率スキルは、何年も使われなくなった後は確かに弱くなります。
JPMaverick 2018

「Aからの任意の配信」と比較して「Bからの任意の配信」について質問しているため、答えは保持されます。Aが午前8時から午前10時ではなく午前6時から午前10時まで配達する場合を想像してください。これで、Bからのランダム配信がAからのランダム配信の前に実行される可能性はさらに低くなります。Bの時間外に発生するAの配信をカウントしない場合、Aの配信ウィンドウをより早く延長しても効果はありません。
Nuclear Wang

完璧です。本当にありがとう。私はTHATプログラムに参加しないと思います、笑
JPMaverick

私はまだこれを手放すことができないようです。Aのウィンドウが拡張されることは、「すべてのBの旅行のうち、少なくとも1つのAの旅行の前に何パーセントが発生したか」という質問である場合は無関係であるように思われるためです。分布は均一であるため、Aの配信ウィンドウを延長しても、重複する可能性のあるトリップの数は変わりません。質問がBのみについて提起された場合(実際)、AとBの両方の配信率を知らなければ、実際には答えはあり得ないようです。私が密集している場合は申し訳ありませんが、これが退屈になっても完全に理解できます
JPMaverick

1
@JPMaverick、質問の正確な表現が重要であることに同意します。この回答は、「Bからの任意の指定配信」および「Aからの任意の指定配信」と表現されている場合に機能します。「Bからの任意の配信」と「Aからの任意の配信」を比較する場合、Aが行う配信の数を知る必要があります。Aが8から10の間に100万回配信する場合、Aが何かを配信する前にBからのランダム配信が発生することはほとんどありません。その時間内にAが2回しか配信しない場合、Aからの「任意の」配信(つまり、Aからの最初の配信)の前に「Bからの任意の指定配信」が発生する可能性があります。
Nuclear Wang

3

配信レートが指定されていないため、Aが1時間あたりパッケージを配信し Bが1時間あたりのパッケージを配信すると仮定ます。したがって、の配信時間のペアがあります。配信時間内でAとBが重複するウィンドウにはペアしかなく半分はAがBの前にあります。したがって、AがBの前にくるペアの比率は ab2a2bab

ab212a2b=18.

0

もちろん、インタビュー中にPCがあった場合にのみ、別の見方を提案します。

Rたとえば、プロセスをシミュレーションできます。

Aからの1000の値とBからの1000の値をシミュレートしてみましょう。どちらも均一で、独立していることがわかります。

a <- runif(1000, 8, 10) # A deliveries
b <- runif(1000, 9, 11) # B deliveries
# [1] 9.485513 8.665070 8.488481 8.840332 8.755384 9.448949 # A deliveries for example

わかりました、正確には時間ではありませんが、同じです。

確率は私たちが求めるものです。したがって、コード内でであるペアの数を数えるだけです。P(B<A)b<a

prob <- sum(b < a)/1000
#[1] 0.112 # almost 1/8

1000ペアプロットして、Bが最初に来る領域を確認することもできます。(a,b)

plot(a, b)
polygon(c(9, 10, 10, 9),
        c(9, 9, 10, 9), density = 10, angle = 135)

ここに画像の説明を入力してください

prob上記の値は、シェーディングされた領域内のポイントの比率です(見慣れたように見えませんか?)。

これで、比率の標準誤差の式を使用して、シミュレーションの標準誤差を推定できます。

se <- sqrt(prob * (1 - prob) / 1000)
#[1] 0.009972763

そして、CIを構築できます(サンプル分布の正規近似を想定probs)。

prob - 1.96*se
#[1] 0.09245338 lower bound
prob + 1.96*se
#[1] 0.1315466 upper bound

-1

これを偶然見つけ、それが私の頭の中にありました。:-)

答えは、可能性のあるオーバーラップの時間(9a-10a)に各トラックが行う配達の相対的な数に依存する必要があるようです-一定の答えはありません。

たとえば、各トラックが合計2回の配達(1時間に1回)を行うとします。彼らはそれぞれ9から10の間に1つの配信を行い、BはAから何も打ち負かしません。したがって、その場合の確率は0です。

両方が9-10aの間でしか配信を行わない問題の単純化されたバージョンを考えてみます(まだ均一な分布です)。そして、最初に、同じ数の配達を行うと仮定します。

  • Bの最初の配信は、Aからの最初の配信(結びついている)を除くすべてに勝ります。したがって、確率(Bの最初の配信である確率)で、確率(最初の配信ではない確率)でイベントを打ちますA)の1nn1n
  • Bの2番目の配信は、Aからの最初の2つの配信を除くすべてに勝ります。したがって、確率で、確率イベントに勝ち1nn2n

これらの各用語を要約すると、次のようになります。

(1nn1n)+(1nn2n)+...+(1nnnn)

または、

i=1nnin2

確率は均一であり、それぞれの半分(切り捨て)は1時間のオーバーラップ中に発生するため、それぞれの半分の配信のみを考慮します。場合と、ドメイン全体に比べて、これらのイベントは、半分の時間が起こります。そうn=n2

12i=1nnin2

私は場合、と思います。a=b=n1/8

AとBが同数のパッケージを提供しないという事実をどのように処理しますか?繰り返しますが、簡単にするために、すべての配達が午前9時から10時の間に発生すると仮定します。

上記のように、トラックAから少なく連続して配信するのではなく、最初から最後までのすべての配達について検討します(はトラックAによって行われた配達の数、は配達の数です))によって作成された場合、を削除します。つまり、あなたはすべてが、分数ビートの割合に比例しあなたが投げてきました。そう、b1aabb1baab

(1ba1aba)+(1bn2aba)+...+(1baaaba)

または、

i=1baiabab

繰り返しますが、それらは半分の時間しかオーバーラップしないという事実を考慮して、ととしましょう:a=a2b=b2

12i=1baiabab


質問は確率を求めます。数式がと間の結果を生成するおよび現実的な値を見つけることは困難ため、それら間違っている必要あります。他の回答者が示したように、そこにあるユニークな答えが。これは、各トラックの配送時間の確率分布が均一であるという仮定から導き出されます。a,b,n01,
whuber

-1

ゼロです:

Bトラックに[9-11]の期間に少なくとも1つの配達がある場合、少なくとも1つの配達が10の後(またはに等しい)に行われます。

そしてその配達はAの配達の前ではありません(すべて10の前です)

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.