冗長性を処理するランダム効果モデル


9

私は、繰り返されるバイナリ結果を使用して、イベント発生までの時間を分析しようとしています。イベント発生までの時間を日数で測定するとしますが、ここでは時間を週単位で離散化するとします。繰り返しバイナリ結果を使用して、カプラン・マイヤー推定量を近似したい(ただし、共変量は可能)。これは遠回りの方法のように見えますが、これが通常の結果や繰り返し発生するイベントにどのように拡張されるかを調査しています。

3週間で打ち切られた誰かが000、4wで打ち切られた誰かが0000、5wで失敗した対象が0000111111111111 ...のようなバイナリシーケンスを作成した場合(1は、最後の対象があった点まで拡張されます)研究で続いています)、1の週固有の比率を計算すると、通常の累積発生率を得ることができます(変数の打ち切り時間に到達するまで、これは概算のみですが、カプランマイヤー累積発生率推定と等しくありません)。

上記のように時間を離散化する代わりに、時間内のスプラインを使用する代わりに、GEEを使用してバイナリロジスティックモデルを使用して、繰り返されたバイナリの観測を近似できます。クラスターサンドイッチ共分散推定器は、適切に機能します。しかし、混合効果モデルを使用して、より正確な推論を得たいと思います。問題は、最初の1の後の1が冗長であることです。だれでも、変量効果を指定する方法、または標準誤差が収縮しないように冗長性を考慮に入れるモデルを指定する方法を知っていますか?

エフロンはリスクセットの条件付き確率を推定するためにロジスティックモデルを使用していたため、この設定はエフロンとは異なります。無条件の確率を推定しています。

回答:


3

GEEまたは反復バイナリ観察の混合モデルの両方で確認できる限り、最初の「1」が観察された後、モデルが「0」に正の確率を割り当てるという問題があります。

いずれの場合も、GEEと同じ解釈を持つ混合効果ロジスティック回帰から推定値を取得する場合(詳細についてはこちらを参照)、GLMMadaptiveパッケージのmixed_model()関数を使用してモデルを近似し、次に使用します。例については、こちらをご覧くださいmarginal_coefs()


1
Dimitrisに感謝します。冗長な1の場合(平均関数を正しくするため)、変更されたモデルまたは奇妙なランダム効果の設定が必要になると思います。このGLMMadaptiveパッケージは、より一般的な設定では素晴らしいものに見えます。
フランクハレル

2

これに関するいくつかの考え:

  1. 混合効果モデルは基本的に「条件付き」確率モデルであるようです。つまり、そのイベントのリスクがある対象のイベントの確率は何ですか。

  2. 最初の「1」が1になった後の「1」の確率はわかっています。したがって、後続の「1」の値に追加情報はありません。

  3. 後続の「1」の値には追加情報が含まれていないため、尤度関数には影響がなく、尤度ベースの推定量の標準誤差にも、推定自体にも影響がないようです。実際、モデルのパラメーター値に関係なく、p(y = '1' | x)= 1の場合、本来の '1'値の影響はありません。

  4. この動作を強制し(つまり、p(y = '1' | x)= 1)、必要な平均関数を保持し、後続のモデルをマークするインジケーター共変量をモデルに追加し、その係数を強制することにより、非常に大きくなるため、効果的にp(y = '1' | x)= 1になります。

  5. おっしゃったように、最初の「1」以降の応答を100%相関させる方法もあるかもしれません。しかし、二項モデルでは、それは後続の応答のp(y = '1' | x)= 1と同じです。


1
マットに感謝します。完全なモデルではなく、方程式の推定に満足している場合、得られるのは、スコア関数に重複した応答を追加して平均関数を正しくすることですが、情報関数には追加していません。指標の共変量を追加することはできないと思います。これは、たとえば、治療効果から生じるためです。混合効果モデルは、無条件モデルのようなものだと思います。イベントが吸収状態ではない場合、時間依存の方法で限界効果をモデル化しています。
フランクハレル

1

あなたが何をしようとしているのか正確にはわかりませんが、プールされたロジスティック回帰モデル(https://www.ncbi.nlm.nih.gov/pubmed/2281238)に適合できますか?この場合は、ターミナルイベントの間隔中に1のみを含めます。イベントが発生した後は繰り返されません。柔軟な方法でモデルに時間を含めます(たとえば、スプラインを使用して拡張)。


1
Hey Bryan-私はプールされたロジスティック回帰が本当に好きで、頻繁に使用しています。しかし、最終イベントでサブジェクトの観測を終了し、イベントなしでそのポイントを超えて他のサブジェクトを追跡させると、平均関数(P(event by time t))が誤って取得されます。少なくとも特殊なケースでは、平均関数のカプランマイヤーに近い累積発生率の推定値を取得したいと考えています。
フランクハレル
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.