少し単純化しますと、約10年間にわたるシステムの人々の入口時間と出口時間を記録するレコードが約100万個あります。すべてのレコードにエントリ時間がありますが、すべてのレコードに終了時間があるわけではありません。システムの平均時間は約1年です。
終了時間の不足は、次の2つの理由で発生します。
- その人は、データがキャプチャされたときにシステムを離れていません。
- その人の退出時刻は記録されませんでした。これはたまたまレコードの50%と言っています
関心のある質問は次のとおりです。
- 人々はシステムに費やす時間が少なく、どれだけ時間が少ないのでしょうか。
- より多くの終了時間が記録されていますか。
これをモデル化するには、出口が記録される確率が時間とともに線形に変化し、システムの時間には、パラメーターが時間とともに線形に変化するワイブルがあるということです。次に、さまざまなパラメーターの最尤推定値を作成し、結果を眼球で確認し、それらを妥当であると見なします。ワイブル分布を選択したのは、寿命の測定に使用されているようで、ガンマ分布よりもデータを適切にフィッティングするのではなく、言うのが楽しいからです。
これを正しく行う方法についての手掛かりを得るために、どこを探すべきですか?私たちは幾分数学に精通していますが、統計的に極端に精通しているわけではありません。