あなたが持っているのは、生存時間分析とも呼ばれるイベントまでの時間データです。それは本当に私の領域ではないので、ここでは詳細な答えをしていません。「イベントまでの時間データ」または「生存分析」をグーグルで検索すると、多くのヒットが得られます。
良い出発点の1つは、Venables / Ripley:MASSの生存分析に関する章(13)、またはJohn D. Kalbfleisch、Ross L. Prentice(auth。)
編集、拡張された回答
生存分析の代替として、順序ロジスティック回帰により近似することができます。たとえば、最初の凍結日の例では、「凍結前または凍結前」状態、0(凍結なし)、1(凍結)を指定する日付を定義します。凍結することなく何年も快適に対応できます。応答ベクトルはすべてゼロです。たとえば、選択した日付が
1:08 15:08 1:09 15:09 1:10 15:10 1:11 15:11 1:12 15:12 1:01 15:01
and the actual date of first freezing was 17:11, then your observed vector will be
0 0 0 0 0 0 0 0 1 1 1 1
そして、一般に、すべての応答ベクトルにはゼロの初期ブロックがあり、その後に1のブロックが続きます。次に、これを順序ロジスティック回帰で使用して、各日付の推定凍結確率を取得できます。その曲線をプロットすると、生存曲線の近似値が得られます(この文脈では、生存は「まだ凍結していない」になります)。
EDIT
また、毎年(ほぼ)川が凍結するため、データを繰り返し発生するイベントと見なすこともできます。ここでの私の答え: 精神医学的再入院の重要な予測因子を見つける