移民申請書とビザの受け入れ(ビザの付与)を調べるデータセットを持っています。料金はビザ申請の「受理」と「拒否」に対して計算されます。
ただし、データセットには、クローズされたケースの値も含まれています。通常、これは移民が予定まで表示されなくなったか、他の場所に移住したか、死亡したかのいずれかです。率が計算されるときにこれらの数値は使用されないため、率が欠落していると表示されることがよくあります(ケースが受け入れられず、拒否もされなかったため)。
そうは言っても、その年の唯一のケースが「その他の方法でクローズ」された場合、これらの観察を破棄しても大丈夫でしょうか?私が抱えている問題の一部は、その年の唯一の決定がクローズされたため、データセット内のランダムな年が削除されることです。
さもなければクローズされたケースは非常に恣意的であり、私が述べたように、おそらく移民がどこか別の場所に移住し、おそらく最初の国を一時的な通過場所として使用したケースです。データは移民がなぜ去ったのか、なぜ彼らが閉じられたのかなどを具体的に述べていません。私はこれらの欠損値をどのように処理するのか本当にわかりません。レート計算のため、ここでは標準の補完法が機能するとは思わない(ただし、間違っている可能性がある)。