疫学者/公衆衛生の同僚に高度な予測モデリングを穏やかに導入するにはどうすればよいですか?


8

社会科学と疫学の背景から来た私の同僚は、最小二乗回帰、ロジスティック回帰、および生存分析について訓練を受けました。彼らは、95%の信頼区間とパラメーター係数のp値を確認することを好み、ニューラルネットワーク、CART、バギングとブースティング、ペナルティ付き回帰手法などの現在の予測ツールに不信感を抱いています。


4
私の短いコースは、とりわけその聴衆を対象としています。配布資料を含む情報は、コースのフルセメスターバージョンのWebサイトにあります:biostat.mc.vanderbilt.edu/CourseBios330。私がカバーする多くの事柄の1つは、オッズ比を得るために対数ロジスティック回帰係数が不合理である理由です。これは、エフェクトを非線形にして、四分位範囲間オッズ比などを取得することを前提としています。
フランクハレル2014

2
私は次の2冊の本が好きです:統計学習の概要:Rのアプリケーション(James、Witten、Hastie、Tibshirani)。統計学習の要素:データマイニング、推論、および予測(Hastie、Tibshirani、Friedman)。また、疫学者は、推定と推論のために、最新のセミ/ノンパラメトリック回帰モデルと比較して、パラメトリック回帰モデル(GLMタイプモデル)を好むこともわかりました。彼らの仕事の多くは、(予測のための)柔軟な回帰当てはめを生成するのではなく、リスク/保護要因の発見/説明に焦点を当てていると思いますか?
クリス

2
@RobertF:ほとんどの職業(慣性?)に当てはまります。ただし、疫学者は通常、説明モデルに関心を持っています。たとえば、交絡や関心のある露出についての相互作用を評価したい場合、ペナルティのようなより新しい予測手法をどのように利用すればよいかが常に完全に明確であるとは限りません。フランク・ハレルのコース、本、彼の部署。サイトには、疫学にも適用できる有用な資料がたくさん含まれています。
トーマスシュパイデル14

1
@RobertF:これは私が理解するのが難しいものです。オーバーフィッティングを減らすために意図的に効果推定にバイアスをかけている場合、それらを解釈したいときに、バイアスがかけられていなかったかのようにそれらをどのように扱うことができますか?
Thomas Speidel 14

1
@Chris疫学者が使用する最も一般的な生存分析ツールの1つは、セミパラメトリックモデルです。
フォミテ

回答:


6

私は疫学者として検量します。

ヘルスケア分野の研究者や専門家が中間管理職やそれ以降に移動し、統計の新しい進展に触れていないため、慣性が見え始めています。

まず、これは単に慣性であると想定しないように強くお勧めします。これは、新しい手法を採用したくないという規律の形、または統計の新しい進展に触れていない同僚のどちらかです。方法論的に非常に洗練された新しい作業が行われている学術疫学会議に参加することはできますが、必ずしも予測モデリングに多くのことを見出しているわけではありません。

ヒントは名前にあります。予測モデリング。

疫学は、分野として、それ自体のために予測に特に興味を持っています。代わりに、それは集団で観察された疾患パターンの病因学的説明の開発に焦点を当てています。2つは関連していますが、明確であり、モデルの予測への影響を最大化しようとするより近代的な分類および予測手法に対する哲学的不信につながることがよくあります。これの最端にいるのは、変数の選択は主に有向非循環グラフのようなものを使用して実行されるべきであるという意見の人々です。

その結果、それは彼らの背景の一部ではなく、文学で彼らが遭遇するものではなく、完全に率直に言えば、彼らが経験している問題を実際に理解していない人々を介してそれらにさらされている可能性が高い解決する。

これはコメントで、完璧な例です:

これは一部の人々を投げます-予測精度を向上させるためにペナルティ付き回帰に意図的にバイアスを導入しているという事実

私が知っているほとんどすべての疫学者は、あなたがそれらを選択した場合、精度の向上よりもバイアスの減少を選択するでしょう。

それが育てられることは決してないということではありません。予測モデルが使用される場合があります-多くの場合、この特定の患者の転帰の予測が非常に重要である臨床ケース、またはアウトブレイクの検出では、何が起こっているのかわからず、病因を特定できないため、これらの手法が役立ちます。引数。または、予測が本当に目標である場合-たとえば、多くの曝露推定モデルで。彼らは、フィールドでいくぶんニッチです。


これが少し不快であると申し訳ありませんが、そうではありません。疫学者の訓練のどれくらいが統計学および/または数学にありますか?純粋に私自身の経験から、私が出会った(そして私はかなりの数に出会った)疫学者は、彼らが示したモデルを使用および解釈するために統計的に備えが不十分でした。それらの多くは、複数のテストの修正やその他の実用的な問題などの基本的な概念を理解していません。これについてコメントしていただけませんか。私は単に悪い疫学者に会っただけですか、それとも分野全体の現象ですか?繰り返しますが、そうではなかったことを願っています
Chris C

1
@ChristC問題の一部は、「統計学者」と比較して、疫学者は非常に広い分野です。ほとんどの地域の公衆衛生の問題についてはそれで十分なので、2x2のテーブルと数学を長い除算と同じくらい複雑にすることができる多くの人々がいます。1 / n
Fomite

1
いくつかの分野の奇妙な点もあります(UNCのチャーリープールには、再論争があります:疫学では複数の比較修正が欠陥のある概念です)。ほとんどのエピはモデルのユーザーであり、率直に言って、統計プログラムはしばしばそれらを教えることに全く無関心です。2 / n
Fomite

1
スペクトルの反対側には、因果推論、システムモデル、競合リスクなど、非常に知識が豊富で、エピに焦点を合わせた問題に取り組んでいる非常に高度な方法論者がいます。それはすべて、彼らがどのような仕事をしているのか、その背景などに非常に大きく依存しています。n/ n
Fomite

1
@ChrisC私が思い出した特に実例となる例。同じ会議の同じセッションで、調和関数を含む回帰モデルを使用して季節性をモデル化するための新しい(多少派生した場合)アプローチを紹介しました。私の前の話?円グラフ。どちらも非常に「疫学」と呼ぶことができます。
Fomite
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.