暴力の発生を説明する2年間のデータ-病棟の患者数との関連

私は基本的に次のような2年間のデータを持っています。

日付 _ __ 暴力Y / N？_ 患者数

2008年1月1日 _ ___ 0 __ _ __ _ ____ 11

2008 年2月1日_ __ _ 0 _ __ _ __ _ __ 11

2008年3 月1日_ ____ 1 __ _ __ _ ____ 12

2008年4月1日_ ____ 0 __ _ __ _ ____ 12

...

2009/12 / 31_ _ __ 0_ _ __ _ __ _ __ 14

つまり、精神病棟の2年間の観察（1日1回）で、その日に暴力事件が発生したかどうか（1はイエス、0はノー）と病棟の患者数を示します。テストしたい仮説は、病棟でのより多くの患者が病棟での暴力の可能性の増加と関連しているというものです。

もちろん、病棟に患者が多くなると、患者の数が増えるために暴力が発生する可能性が高くなるという事実を調整しなければならないことに気づきます。私たちは、各個人の暴力の確率が上昇するかどうかに関心があります病棟にはより多くの患者がいます。

私はロジスティック回帰だけを使用するいくつかの論文を見てきましたが、自己回帰構造があるため、それは間違っていると思います（ただし、自己相関関数を見ると、遅れて.1を上回っていませんが、これはRが描く「重要な」青い破線。

さらに複雑にするために、結果を個々の患者に分解したい場合は、データを上記のように表示しますが、各患者のデータは2008年1月1日です。 1/2008など。IDコードは側面に表示されるので、データは各患者のインシデントの履歴全体を個別に示します（すべての患者が1日中存在するわけではありませんが、問題かどうかは不明です）。

Rでlme4を使用して各患者の自己回帰構造をモデル化したいのですが、一部のグーグルは「lme4は自己回帰構造を処理するように設定されていません」という引用を思い付きます。とにかく、どうやってコードを書けばいいのかわからない。

誰かが気づいた場合に備えて、私は少し前にこのような質問をしました、それらはさまざまな問題を持つさまざまなデータセットですが、実際にこの問題を解決するとその問題を解決します（誰かが以前に混合メソッドを使用することを提案しましたが、この自己回帰により、これを行う方法がわかりません）。

だから私は少し行き詰まり、正直に迷っています。助けてくれてありがとう！

r mixed-model autocorrelation panel-data

— クリス・ビーリー
ソース

私は同様の問題を扱っていますがpgmm、plmパッケージから使用できると思いますが、応答変数がバイナリであるため、正確な方法がわかりません。たぶん、他の人が詳しく説明できるかもしれません...（そうです、そうです：私の理解では、内生変数がある場合はいつでも、この場合は遅れた値です。REMLは偏っているため、推定にREMLを使用できないため、GMMを使用する必要があります。）

— テウクロス

以下は、バイナリ従属変数を観測されていない連続変数に接続するアイデアです。連続変数の時系列モデルの力を活用できる接続。

定義：

$V_{w,t} = 1$ $w$ $t$

$P_{w,t}$ $w$ $t$

$P_{w,t}$

$V_{w,t} = \begin{cases} 1 & \mbox{if } P_{w,t} \ge \tau \\ 0 & \mbox{otherwise} \end{cases}$

どこ、

$\tau$

$P_{w,t}$ $P_{w,t}$

$P_{w,t} = \alpha_0 + \alpha_1 P_{w,t-1} + ... + \alpha_p P_{w,t-p}+ \beta n_{w,t} + \epsilon_t$

どこ、

$n_{w,t}$ $w$ $t$

$\beta$

$P_{w,t}$