病気の出現確率を計算する


8

私は医者ですので、私と統計の基本的な理解に親切にしてください。

患者とその訪問からなるデータセットがあり、左手または右手、あるいはその両方に特定の種類のほくろの存在を{0,1}の値でラベル付けしました(0 =存在せず、1 =存在)。データセットは次のようになります。

**回答が提供されたので削除しました。新しいリクエストに応じて送信できます

つまり、患者A1-001には6回の通院があり、すべての通院で右手にほくろがなく、1回目以外のすべての通院では左手にほくろがありました。

片方の手でほくろを発症した患者のみの間で手がほくろを発症する確率を見つけ、もう一方の手でほくろを発症する確率を見つけることに興味があります(患者がもう片方の手ですでにほくろを持っている場合) 。

さらに、両手である時点でほくろを発症した患者の中で、通院中にほくろを発症する確率はどのくらいか知りたい

これらの簡単な質問をモデル化するのを手伝ってくれませんか?


「さらに、私は、両方の手でどこかの時点でほくろを発症した患者の中で、同じ訪問でほくろを発症する確率はどのくらいか知りたいのです。」—しかし、モルを数えるのではなく、片手でモルを存在または不在としてコーディングしているので、患者がすでに両手にモルを持っている場合、追加のモルはどのようにデータに表示されますか?
コディオロジスト2018年

@Kodiologistはい、私は存在だけに興味があり、ほくろの数には興味がありません。患者がすでに片手にほくろを持っている場合、追加のほくろを持つことはできません。このほくろと一緒にいるか、またはほくろが消えるだけです。
laza

2
完全なデータセットを提供すると、質問が明確になり、回答を受け取るのに役立ちます。
トッドD

@Toddデータセット全体を提供すると問題の解決策がどのように変わるかわかりません。私は数学者ではありませんが、このサンプルサイズでも問題は明確です。Iは、N = 3(患者の数)N = 100のための問題を解決すると同じになるため、問題を解決する推測
ラザ

1
@laza、数学は数学者にとって難しいことではありません。しかし、あなたは数学ではなく、あなたが何を意味しているのかを理解しようとすることで問題を提起します(そのため、より大きなデータセットが要求されたのです)...... 「私は、両方の手である時点でほくろを発症した患者が同じ訪問でほくろを発症する確率。?コディオロジストからの質問には答えませんでした
Sextus Empiricus

回答:


5

私は個人的にこれが生存分析に向いていると感じています。

あなたは期間の初めに特定の手にほくろのない人々(あなたの危険にさらされている人口); あなたはこれらを選択することができ、フォローアップのタイムポイントがあり、それらが検閲されたかどうか(モルを開発したかどうか)があります。これは、選択したコホートに危険をもたらします。

次に、ハザード比を計算できます(たとえば、ベースラインに左側のほくろがある人と右側のほくろがない人の右側のほくろを開発する場合など)。これはカプランマイヤーグラフで表すことができ、信頼区間が付属します。


こんにちは@ジェームズ、私はこのライフラインにショットを与えると思います。readthedocs.io/ en / latest /… どう思いますか?
laza

それは大丈夫だと確信しています。私はpythonが好きですが、一般的に統計にはRを好みますが、これはかなりサポートされているようです。
ジェームズ

データを正しい形式にするためのヒントを1つまたは2つ教えてください。
laza

それが言うように、人々が観察された時間と彼らが「死んだ」(すなわち、モルを手に入れた)時、または最後に彼らがモルを手に入らなかった場合に見られた時間を知る必要があります。したがって、すべての患者について、最初にほくろなしで彼らを見たときから、彼らがほくろを手に入れるか最後に見られたときまでの時間を追跡します。これは、サンプルリンクの「T」列です。「E」列は、彼らがほくろを得たかどうかです。次に、患者ごとに1行が必要です。
ジェームズ

しかし、患者が最初の訪問ですぐにほくろを持っていた場合はどうなるでしょうか そして別の質問で、なぜマルコフ連鎖がこの問題に適していないと思いますか?それは移行の問題であり、私が読んだことから、これらの種類の問題に取り組むには非常に適しているようです。
laza

0

ここで行うモデリングはありません。すべての質問は単純な条件付き確率です。

了解しました。人々がその答えを評価しなかったので、いくつかのことを明確にする必要があります。

片方の手でほくろを発症した患者のみの間で手がほくろを発症する確率を見つけ、もう一方の手でほくろを発症する確率を見つけることに興味があります(患者がもう片方の手ですでにほくろを持っている場合) 。

訪問ごとのことですか?それとも彼らがこれまでにモルを開発したことがないのですか?あなたの例から:

患者1と3は片手でほくろを発症しました。一方、患者1はほくろを発症しませんでしたが、患者3はほくろを発症したため、質問に対する答えは50%であると主張できます。今度は、患者1が1モルで4回の診察を行い、他の患者ではなく、患者3が1モルで他の診察を行っていないため、確率は1/5 = 20%であると主張することもできます。質問の定義方法によって異なります。


お返事ありがとうございます。それでも手伝ってくれませんか?とても感謝しております。しかし、私の同僚の何人かは、データまたはベイジアン統計に縦断的モデリングを使用するように私に言いました。これらはここには当てはまらないと思いますか?
laza

3
確率に関するいかなる記述も本質的にモデルであるので、この投稿は質問に答えません。重要な問題は、「それはどのモデルですか(または、それである必要がありますか?)」です。
whuber

0

個人的には、多共分散の一般化線形モデルを検討することから始めることができると思います:https : //cran.r-project.org/web/packages/mcglm/index.html

https://cran.r-project.org/web/packages/mcglm/vignettes/GLMExamples.html

http://cursos.leg.ufpr.br/mcglm4aed/slides/2-mcglm.html#(1)

これらのモデルは、2つ以上の応答変数があり、ガウス分布ではない場合に使用されます。これは、2つのバイナリ変数(両手にモルまたはモルではない)があるためです。また、この方法では、縦構造によって与えられる個人内の依存関係を処理できます。ここで、縦方向とは、時間に沿って同じ個人に対して繰り返される測定を意味します。

上記のリンクは、これらの手法についての良いアイデアを得るのに役立つと思います。また、Rでの計算の実装も提供します。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.