タグ付けされた質問 「epidemiology」

疫学は、人口レベルでの病気や病気の分布と広がりの研究です。

8
Facebookは終了しますか?
最近、この論文は多くの注目を集めました(例えばWSJから)。基本的に、著者はFacebookが2017年までにメンバーの80%を失うと結論付けています。 彼らは、疫学でよく使用されるコンパートメントモデルであるSIRモデルの外挿に基づいて主張しています。彼らのデータは「Facebook」のGoogle検索から得られ、著者はMyspaceの終miseを利用して結論を​​検証します。 質問: 著者は「相関は因果関係を暗示するものではない」という間違いを犯していますか?このモデルとロジックはMyspaceで機能していたかもしれませんが、どのソーシャルネットワークでも有効ですか? 更新:Facebookが反撃 「相関は因果関係に等しい」という科学的原則に沿って、私たちの研究は、プリンストンが完全に消滅する危険があることを明確に示しました。 私たちは、プリンストンや世界の空気供給がすぐにどこかへ行くとは考えていません。私たちはプリンストン(と空気)が大好きです」と、「すべての研究が平等に作成されているわけではありません。また、いくつかの分析方法はかなりおかしな結論に導く」という最後のリマインダーを追加します。

5
回帰を理解する-モデルの役割
パラメータを取得しようとしている関数がわからない場合、回帰モデルはどのように使用できますか? 私は、子供を母乳で育てた母親は、後の人生で糖尿病を患う可能性が低いと言った研究を見ました。この研究は約1000人の母親の調査から得られたもので、さまざまな要因が管理されており、対数線形モデルが使用されました。 これは、糖尿病の可能性を決定するすべての要因を考慮して、ログを持つ線形モデルにきちんと変換される素敵な機能(おそらく指数関数的)と、女性の母乳が統計的に有意であることが判明したことを意味しますか? 私は確かに何かを見逃していますが、彼らはどのようにモデルを知っていますか?

2
バイナリ結果の相対リスクを推定するポアソン回帰
簡単な要約 ポアソン回帰(相対リスク)に対して、ロジスティック回帰(オッズ比)がバイナリ結果のコホート研究で使用されるのはなぜ一般的ですか? バックグラウンド 私の経験では、学部生および大学院生の統計学および疫学コースは、一般に、リスク推定値をオッズ比として報告するバイナリ結果のデータのモデリングにロジスティック回帰を使用する必要があることを教えています。 ただし、ポアソン回帰(および関連:準ポアソン、負の二項分布など)を使用して、バイナリ結果のデータをモデル化することもでき、適切な方法(堅牢なサンドイッチ分散推定量など)を使用して、有効なリスク推定値と信頼レベルを提供します。例えば、 Greenland S.、一般的な結果の研究および症例対照研究における相対リスクおよび他の疫学的測定のモデルベースの推定、Am J Epidemiol。2004 8月15日; 160(4):301-5。 Zou G.、バイナリデータを使用した前向き研究への修正ポアソン回帰アプローチ、Am J Epidemiol。2004 4月1日; 159(7):702-6。 Zou GYおよびDonner A.、相関バイナリデータを使用したプロスペクティブ研究への修正ポアソン回帰モデルの拡張、Stat Methods Med Res。2011 11月8日。 ポアソン回帰から、相対リスクを報告することができます。これは、特に頻繁な結果、特に統計に強いバックグラウンドを持たない個人にとって、オッズ比と比較して解釈しやすいと主張する人もいます。Zhang J.とYu KF、相対的なリスクは?一般的な結果のコホート研究におけるオッズ比を修正する方法、JAMA。1998年11月18日; 280(19):1690-1。 医学文献を読むと、二値アウトカムのコホート研究の中で、ポアソン回帰の相対リスクよりもロジスティック回帰のオッズ比を報告するのがはるかに一般的であると思われます。 ご質問 バイナリ結果のコホート研究の場合: ポアソン回帰の相対リスクではなく、ロジスティック回帰のオッズ比を報告する正当な理由はありますか? そうでない場合、医学文献の相対リスクを伴うポアソン回帰の頻度は、主に科学者、臨床医、統計学者、および疫学者の間の方法論と実践の間の遅れに起因する可能性がありますか? 中間統計と疫学のコースには、バイナリ結果のポアソン回帰の詳細な議論を含めるべきですか? 学生や同僚に、適切な場合にロジスティック回帰よりもポアソン回帰を考慮するように勧めるべきですか?

2
喫煙によって実際にどのくらいの肺がんが引き起こされますか?[閉まっている]
たばこ製品については、肺がんの10分の9は喫煙が原因であるという統計をよく見ることができますが、この数字は正確ですか? この統計については、2つの理由で懐疑的です。 まず、米国とノルウェーのタバコ消費率を経時的に比較し、男性の肺がん率と比較すると、次のチャートを作成できます。あなたは、米国のためのたばこ消費量のデータを得ることができ、ここで、ノルウェーのために、ここから、両方の国のがんデータをここに。 米国では、肺がんの10分の9が喫煙によって引き起こされる可能性が非常に高いように見えますが、ノルウェーでは、喫煙が比較的少ないために肺がんが非常に多いため、非常に疑わしいと思われます。米国では原因(タバコ)が影響(肺癌)の前に来ますが、ノルウェーでは原因(タバコ)が影響(肺癌)の後に来るようです。これは、ノルウェーの場合、喫煙が10個中9個の肺がんを引き起こすという仮説を裏付けていません。 ノルウェーの好奇心に加えて、別の問題があります。アメリカなどの国では、数十年にわたって何百万人もの人々が禁煙を奨励されており、肺がん率が低下しています。しかし、旧ソビエト連邦の国々では、何百万人もの人々が禁煙を奨励されておらず、その結果、これらの国々の一人当たりのタバコ消費量は今日まで安定しています。 ですから、偶然にも、数十年にわたって何百万人もの人々が禁煙を奨励することで肺がんの発生率に違いがあるかどうかを調べるための大規模な実験(数十億年)があります。おそらく、喫煙と肺癌に対する史上最大の実験だと思います。アメリカ(人口3億2570万人)、ロシア連邦(人口1億4400万人)、ウクライナ(人口4500万人)の3か国の男性肺がんがあります。 明らかに、これらの国々では男性の肺癌は米国と同じように減少していますが、喫煙の先行減少はありません。 第二に、米国では、以下の国民健康調査によると、肺がんの17.9%が非喫煙者に発生しています。 私の考えでは、喫煙していない人に発生する肺がんの17.9%という数字は、喫煙によって引き起こされる肺がんのうち9つを支持できないものにしている。 この数値を計算するためにあなたが本当に知る必要があるのは、成人人口の何パーセントが喫煙者ではないかであると思いますが、この数値は米国にとって驚くほどわかりにくいと思います。私が見つけることができる最も近いものは、米国では人口の22.2%、現在の喫煙者39.4%、元喫煙者38.5%は決して喫煙者ではない、と述べている研究です。 しかし、これは正しくない可能性があり、著者は現在の喫煙者を決して喫煙していない人と入れ替えたと思います。決して喫煙していない人の数は実際に39.4%であり、現在の喫煙者の数は実際に22.2%です。これは非常に不満足ですが、現在の喫煙者の数字を見つけることは簡単ですが、喫煙していない人の数字を見つけることは難しいことがわかりました。 したがって、喫煙によって引き起こされる肺がんの数が10分の9ほどにならない理由について、いくつかの関連する疫学統計(そして読者にとって興味深いこと)を示したので、私の質問は次のとおりです。 肺がんの17.9%が喫煙者でなく喫煙者でもないという統計を考えると、人口の39.4%が実際に喫煙によって引き起こされる肺がんの量はどれくらいですか?

2
少量サンプル研究での探索的データ分析とデータdrへの対処方法
探索的データ分析(EDA)は、多くの場合、必ずしも初期の仮説セットに属するとは限らない他の「トラック」を探索することにつながります。サンプルサイズが限られており、さまざまなアンケート(社会人口統計データ、神経心理学的または医学的尺度-精神的または身体的機能、うつ/不安レベル、症状チェックリストなど)で収集された多くのデータがある研究の場合、私はそのような状況に直面します)。EDAは、追加の質問/仮説に変換されるいくつかの予期しない関係(「予期しない」ことは初期分析計画に含まれていなかったことを意味します)を強調するのに役立ちます。 過剰適合の場合と同様に、データのedや索は一般化しない結果につながります。ただし、大量のデータが利用可能な場合、限られた仮説セットを仮定することは非常に困難です(研究者または医師にとって)。 小サンプル研究の場合、EDAの輪郭を描くのに役立つ、よく知られた方法、推奨事項、または経験則があるかどうかを知りたいです。

2
John Snow Choleraの問題を解決するために使用できる統計モデルまたはアルゴリズムは何ですか?
John Snow Choleraのアウトブレイクのデータに基づいて、ある種の震源地の地理的近似を作成する方法を学ぶことに興味があります。井戸の位置を事前に知らなくても、このような問題を解決するためにどの統計モデリングを使用できますか。 一般的な問題として、時間、既知のポイントの位置、およびオブザーバーの歩行経路を利用できます。私が探している方法は、これら3つのことを使用して「発生」の震源地を推定します。

9
カウント<20のカウントデータの時系列
私は最近結核クリニックで働き始めました。現在治療中の結核症例の数、投与された検査の数などについて定期的に話し合います。何かが異常であるかどうかを推測するだけではないように、これらのカウントのモデリングを開始したいと思います。残念ながら、私は時系列のトレーニングをほとんど受けていませんでした。私の露出のほとんどは、非常に連続的なデータ(株価)または非常に多くのカウント(インフルエンザ)のモデルを扱ってきました。ただし、月ごとに0〜18のケース(平均6.68、中央値7、変数12.3)を扱い、次のように配布されます。 [時間の霧に負けたイメージ] [グルーに食われるイメージ] このようなモデルに対処する記事をいくつか見つけましたが、これらのアプローチを実装するために使用できるアプローチとRパッケージの両方について、あなたからの提案を聞いていただければ幸いです。 編集: mbqの答えは、私がここで何を求めているかについて、より慎重に考えることを余儀なくさせました。私は毎月のカウントに夢中になりすぎて、質問の実際の焦点を失いました。私が知りたいのは、たとえば2008年以降の(かなり目に見える)減少は、症例の総数の減少傾向を反映していますか?2001年から2007年までの毎月の症例数は安定したプロセスを反映しているように思えます。多少の季節性があるかもしれませんが、全体的に安定しています。2008年から現在まで、そのプロセスは変化しているように見えます。ランダム性と季節性により毎月のカウントが上下する可能性がある場合でも、ケースの総数は減少しています。プロセスに実際の変更があるかどうかをテストするにはどうすればよいですか?そして、衰退を特定できれば、

2
ROC曲線分析での共変量の調整
この質問は、相関スケールの存在下で、バイナリエンドポイントを予測するための多次元スクリーニングアンケートのカットオフスコアの推定に関するものです。 アルコール依存症のスクリーニングに使用される可能性のある測定スケール(性格特性)の各次元でカットオフスコアを考案する際に、関連するサブスコアを制御することの関心について尋ねられました。つまり、この特定のケースでは、人は外部共変量(予測子)の調整に関心がありませんでした-これは、共変量調整ROC曲線((1-2)など)の下の(部分)領域につながりますが、本質的には他のスコアそれらは互いに相関しているため、同じアンケートから(例えば、「衝動性」と「感覚を求める」)。左側に関心のあるスコア(カットオフを求める)と同じアンケートから計算された別のスコアを含むGLMを構築しますが、右側には結果が飲酒ステータスである場合があります。 (@robinリクエストごとに)明確にするために、我々は持っていると仮定し言う、スコアを(例えば、不安、衝動性、神経症、感覚求めて)を、そして私たちは、カットオフ値の検索したい場合(すなわち、「正の場合」、それ以外の場合は「負のケース」)。通常、このようなカットオフを考案する際に、性別や年齢などの他のリスク要因を調整します(ROC曲線分析を使用)。さて、SSはIMPと相関することが知られているので、性別、年齢、および感覚探索(SS)の衝動性(IMP)を調整するのはどうでしょうか。言い換えれば、年齢、性別、不安レベルの影響が取り除かれたIMPのカットオフ値があります。x j t j x j &gt; t jj = 4j=4j=4バツjxjx_jtjtjt_jバツj&gt; tjxj&gt;tjx_j>t_j カットオフはできる限りシンプルに保つ必要があると言うこととは別に、私の応答は 共変量については、予測パフォーマンスが向上するかどうかを確認するために、調整ありと調整なしでAUCを推定することをお勧めします。ここで、共変量は同じ測定機器から定義された他のサブスコアに過ぎず、このような状況に直面したことはありません(通常、年齢や性別などの既知のリスク要因に基づいて調整します)。[...]また、あなたは予後の問題(すなわち、アンケートのスクリーニング効果)に興味があるので、陽性の予測値(PPV、陽性結果が正しく分類された患者の確率)の推定にも興味があります。アンケートのサブスコアに応じて、被験者を「ポジティブ」または「ネガティブ」に分類できます。ただし、 可能であれば、関連する論文へのリンクを使用して、この特定の状況をより完全に理解していますか? 参照資料 Janes、H and Pepe、MS(2008)。診断、スクリーニング、または予後マーカーの研究における共変量の調整:新しい設定における古い概念。American Journal of Epidemiology、168(1):89-97。 Janes、H and Pepe、MS(2008)。ROC分析における共変量の調整。UW Biostatistics Working Paper Series、ペーパー322。
20 epidemiology  roc 

5
データクリーニングは統計分析の結果を悪化させることがありますか?
ウイルスの循環(2002年の米国の西ナイルウイルスなど)または人々の抵抗の減少、食物や水の汚染の減少、または感染者蚊。これらの流行は、1〜5年ごとに発生する可能性のある外れ値として現れます。これらの外れ値を削除することにより、予測と病気の理解の重要な部分を形成する流行の証拠を削除しています。 流行によって引き起こされた外れ値に対処する際にデータクリーニングが必要ですか? 結果を改善するか、統計分析の結果を悪化させるか?

4
信頼性の低い/混乱した/無効な研究またはモデルが悪用された公衆衛生政策研究のケーススタディとは何ですか?
データが混同されている現在の公衆衛生問題に関する文献レビューを起草しています。 無効または交絡した関係または推論が公衆衛生政策および法律で意図的または誤って採用された公衆衛生/疫学教育で使用される一般的な歴史的事例研究とは何ですか? 法律によって要求されなければならないエアバッグ最終的にシートベルトを決定し、1960年とその後の証拠に基づく、政府主導の研究の自動車致死サージが良い例であるHOW統計的に強力な推論やモデルによって駆動されるべき公衆衛生政策。 私は反対のタイプのケースの例をもっと探しています(政策を急いで作るのは悪い科学です)。しかし、他に何もなければ、公衆衛生の利益を成功させるための強力な研究の前の例と同様の事例をもっと知りたいと思います。 これらを例として使用し、エビデンスに基づいた統計的公衆衛生研究が政策立案にとって重要であることを示したいと思います。

6
条件「B」に対する治療「A」の利点を決定する際の有効性と有効性の違いは何ですか?
この質問のコンテキストは、健康の枠組み内、つまり、状態の治療における1つまたは複数の治療法を見ることです。尊敬されている研究者でさえ、用語「有効性」と「有効性」を混同しているようです。 混乱を取り除くのに役立つ方法で、有効性と有効性をどのように考えることができますか? 両方のタイプの結果を決定するのに、どのタイプの研究デザインが最も適切でしょうか? 信頼できる雑誌の出版物、書籍、またはウェブ辞書はありますか?

2
モデル調整をわかりやすい英語で説明する
特に疫学における統計分析の方法と結果について読むと、モデルの調整や制御についてよく耳にします。 非統計学者に、その目的をどのように説明しますか?特定の変数を制御した後、結果をどのように解釈しますか? StataまたはRでの小さなウォークスルー、またはオンラインへのポインターは、本当の宝石です。

3
マルチレベルモデリングのための例示的なデータセットと分析
最近、マルチレベルモデリングの入門コースを受講しました。使用したデータセットと例のほとんどは、社会科学からのものでした。私は、生物統計学部門で2週間のインターンシップを受けました。そこでは、病院間および5年以上の両方で、死亡率が高い緊急状態の患者の転帰の病院レベルでの変動に関するプロジェクトを開始したいと考えています。期間。私は来週インターンシップを始めていますが、同様の分析(できればR、StataまたはMLwiNを使用)が行われた書籍またはオンラインリソース、できれば読者にデータセットを提供するものを見つけることを望んでいました。どんなリンクでも大歓迎です。 編集:私は、患者の院内ケアのすべての記録された側面を詳述するデータセットで作業します。関心の主な結果は、入院後30日以内の死亡です。

2
正および負の予測値の統計的検定
私は論文を読んでいて、PPV(正の予測値)とNPV(負の予測値)を比較した表を見ました。彼らは彼らのためにある種の統計的検定を行いました。これはテーブルのスケッチです: PPV NPV p-value 65.9 100 &lt; 0.00001 ... すべての行は特定の分割表を参照します。 彼らはどのような仮説検定をしましたか?ありがとう!

7
感度または特異性は有病率の関数ですか?
標準的な教育では、感度と特異度はテストの特性であり、有病率とは無関係であると述べています。しかし、これは単なる仮定ではありませんか? ハリソンの内科第19版の原則 感度と特異度は、テストの正確さの有病率に依存しないパラメーターであると長い間主張されてきました。ただし、この統計的に有用な仮定は、臨床的に単純化されています。...テストの感度は入院患者の方が高く、テストの特異性は外来患者の方が高いでしょう。 (一般的に有病率は外来患者よりも入院患者で高い) これらのパラメーターの間に数学的またはおおよそのグラフィカルな関係はありますか? このリンクでさえ、それを「単純化」と呼んでいます。どうして? 編集:私は感度がどのように定義されているか知っています。回答で述べられているように、有病期間は含まれていません。私自身も、これらのテストの特性は、使用されている母集団に影響されないということを主張しています。しかし、私は、この混乱はこれらの値の定義ではなく実際的な計算が原因で発生していると思います。特異性と感度は2x2の表を使用して計算されますが、参照母集団の有病率は重要ですか?彼らが言及しているのはそれですか?もしそうなら、その機能は何ですか?

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.