単変量分布を調べる良い出発点は、ノンパラメトリック最尤推定量(NPMLE)を調べることです。これはカプラン・マイヤー曲線の一般化であり(それ自体は経験分布関数の一般化です)、累積分布関数のノンパラメトリック推定を提供します。興味深いことに、この推定値は(EDFやカプランマイヤー曲線とは異なり)一意ではなく、区間まで既知です。したがって、単一のステップ関数ではなく、NPMLEをバインドする2つのステップ関数を取得します。
この推定量は分布の形状を調べるのに適していますが、少し不安定になる可能性があります。つまり、推定値の分散が大きくなる可能性があります。標準のパラメトリックモデルに適合させることもできますが、少なくともモデルチェックにはNPMLEを使用することをお勧めします。
標準的な生存回帰モデルの多くが利用可能です(比例ハザード、加速故障時間、比例オッズなど)。興味深いことに、NPMLEは生存曲線の推定値に高い分散を持っていますが、ベースライン分布にNPMLEを使用するセミパラメトリックモデルの回帰パラメーターは不安定性の影響を受けません。そのため、セミパラメトリック回帰法は推論には非常に人気があります。
@Scortchiと@whuberは、観測間隔の開始と終了の生成に関する重要なポイントを提示します(バツs T A R T私、バツe n d私OPで定義されているとおり)。標準的な簡素化の前提(慎重に検討する必要があります)は、一連の検査時間があることです。C0≤C1≤ 、。。。、≤Ck生成される独立して、実際のイベント時間/成果のt関心のあるもの(イベント時間を正確に観察すると平等が発生します)。次に、観察するのは間隔だけですCj、Cj + 1 そのような T ∈Cj、Cj + 1。ただし、イベント時間が検査時間に強く影響する可能性があると思われる場合は、分析に注意する必要があります。例として、関心のあるイベントが虫歯の発症であり、検査が歯科医の訪問であったと仮定します。かなり定期的に歯科医に通う場合、独立性の仮定は合理的であると思われます。しかし、歯が痛いときを除いて、ほとんど歯科医に通わなければ、t 間違いなく影響を与えています Cj!
私のR-のパッケージにこれらのモデルを使用するための簡単なチュートリアルをicenReg
見つけることができるここに。