私は、パネルデータスタディから欠落しているデータの帰属に対処する問題に取り組んでいます(「パネルデータスタディ」を正しく使用しているかどうかはわかりません-今日学んだとおりです)。2003年の総死亡数データがあります。 2009年まで、8つの異なる地区と4つの年齢グループのすべての月(男性と女性)。
データフレームは次のようになります。
District Gender Year Month AgeGroup TotalDeaths
Northern Male 2006 11 01-4 0
Northern Male 2006 11 05-14 1
Northern Male 2006 11 15+ 83
Northern Male 2006 12 0 3
Northern Male 2006 12 01-4 0
Northern Male 2006 12 05-14 0
Northern Male 2006 12 15+ 106
Southern Female 2003 1 0 6
Southern Female 2003 1 01-4 0
Southern Female 2003 1 05-14 3
Southern Female 2003 1 15+ 136
Southern Female 2003 2 0 6
Southern Female 2003 2 01-4 0
Southern Female 2003 2 05-14 1
Southern Female 2003 2 15+ 111
Southern Female 2003 3 0 2
Southern Female 2003 3 01-4 0
Southern Female 2003 3 05-14 1
Southern Female 2003 3 15+ 141
Southern Female 2003 4 0 4
2007年から2008年にかけての10か月の間に、すべての地区での合計死亡者数の一部は記録されませんでした。これらの欠損値を多重代入法で推定しようとしています。一般化線形モデルまたはSARIMAモデルを使用します。
私の最大の問題は、ソフトウェアとコーディングの使用です。Stackoverflowについて質問しました。データを次のような小さなグループに抽出します。
District Gender Year Month AgeGroup TotalDeaths
Northern Male 2003 1 01-4 0
Northern Male 2003 2 01-4 1
Northern Male 2003 3 01-4 0
Northern Male 2003 4 01-4 3
Northern Male 2003 5 01-4 4
Northern Male 2003 6 01-4 6
Northern Male 2003 7 01-4 5
Northern Male 2003 8 01-4 0
Northern Male 2003 9 01-4 1
Northern Male 2003 10 01-4 2
Northern Male 2003 11 01-4 0
Northern Male 2003 12 01-4 1
Northern Male 2004 1 01-4 1
Northern Male 2004 2 01-4 0
に行く
Northern Male 2006 11 01-4 0
Northern Male 2006 12 01-4 0
しかし、誰かが私の質問をここに持ってくるべきだと提案しました-おそらく方向を尋ねますか?現在、このデータを適切な時系列/パネル研究としてRに入力することはできません。私の最終的な目的は、このデータとamelia2
その機能を備えたパッケージを使用してTotalDeaths
、2007年と2008年の特定の月の欠落を補完することです。行方不明。
どんな助け、これを行う方法、そしておそらくこの問題に取り組む方法についての提案は、ありがたく感謝されます。
これが役立つ場合、私はクリントロバーツが博士論文で行ったのと同様のアプローチに従っています。
編集:
@Mattによって提案された「time」および「group」変数を作成した後:
> head(dat)
District Gender Year Month AgeGroup Unnatural Natural Total time group
1 Khayelitsha Female 2001 1 0 0 6 6 1 Khayelitsha.Female.0
2 Khayelitsha Female 2001 1 01-4 1 3 4 1 Khayelitsha.Female.01-4
3 Khayelitsha Female 2001 1 05-14 0 0 0 1 Khayelitsha.Female.05-14
4 Khayelitsha Female 2001 1 15up 8 73 81 1 Khayelitsha.Female.15up
5 Khayelitsha Female 2001 2 0 2 9 11 2 Khayelitsha.Female.0
6 Khayelitsha Female 2001 2 01-4 0 2 2 2 Khayelitsha.Female.01-4
お気づきのように、実際には「ナチュラル」と「不自然」の詳細があります。
Amelia
少し遊んでいますが、あきらめました(これ以前)。私は以前にビネットを見たことがあります(しかし、どういうわけかそれを失いました!)ただそれを簡単に見て、それを完全に通り抜けます。私が今抱えている問題の1つは、group
およびtime
変数の作成方法がわからないことです。(時系列分析/予測のためにそれらを作成してみましたが、ループが発生しました。)きっとそれがビジェットにあると思います-もし私が苦労しているなら、あなたに連絡します。ありがとうございました:)