電車の到着時間に関するデータをモデル化しようとしています。「長く待つほど、電車が現れる可能性が高くなります」をキャプチャするディストリビューションを使用したいと思います。そのような分布はCDFのように見えるはずなので、P(train show up | waited 60 minutes)は1に近くなります。ここでどの分布を使用するのが適切ですか?
電車の到着時間に関するデータをモデル化しようとしています。「長く待つほど、電車が現れる可能性が高くなります」をキャプチャするディストリビューションを使用したいと思います。そのような分布はCDFのように見えるはずなので、P(train show up | waited 60 minutes)は1に近くなります。ここでどの分布を使用するのが適切ですか?
回答:
tとt + d t(待機時間)の間の時間に最初に到着する確率は、
この後者の用語は次のものに関連しています。
または
与える:
待ち時間の確率分布は次のとおりです。
あるいは、時刻がtであるという条件付きで到着が1回未満になる確率の式を使用することもできます。
そして、時間と間に到達する確率は導関数に等しい
このアプローチ/方法は、例えば、ポアソンプロセスのn番目の到着の待機時間としてガンマ分布を導出するのに役立ちます。(ポアソンプロセスの待機時間-ガンマ分布)
これを待っているパラドックスに関連付けることができます(待っているパラドックスを説明してください)。
Constant distribution: If the arrivals are occurring at a constant rate (such as trains arriving according to a fixed schedule), then the probability of an arrival, when a person has already been waiting for some time, is increasing. Say a train is supposed to arrive every minutes then the frequency, after already waiting minutes is and the pdf for the waiting time will be:
So it is this second case, with "then the probability of an arrival, when a person has already been waiting for some time is increasing", that relates to your question.
It might need some adjustments depending on your situation. With more information the probability for a train to arrive at a certain moment might be a more complex function.
Written by StackExchangeStrike
The classical distribution to model waiting times is the exponential distribution.
The exponential distribution occurs naturally when describing the lengths of the inter-arrival times in a homogeneous Poisson process.