タグ付けされた質問 「propensity-scores」

観測された共変量のセットが与えられた場合に、治療を受ける確率。

5
傾向スコアは、回帰に共変量を追加することとどのように異なりますか?
傾向スコアと因果分析に比較的慣れていないことは認めます。 新人として私には明らかではないことの1つは、傾向スコアを使用した「バランス」が、回帰に共変量を追加したときに起こることと数学的に異なることです。操作の違いは何ですか?また、回帰に部分母集団の共変量を追加するよりも優れているのはなぜですか? メソッドの経験的比較を行ういくつかの研究を見てきましたが、2つのメソッドの数学的特性と、PSMが回帰共変量を含むのに因果解釈に役立つ理由に関する良い議論は見ていません。また、この分野では多くの混乱と論争があり、事態をさらに難しくしています。 これについての考えや、区別をよりよく理解するための優れたリソース/論文へのポインタはありますか?(Judea Pearlの因果関係の本をゆっくりと進めているので、それを指す必要はありません)

3
複数の代入後の傾向スコアのマッチング
私はこの論文を参照します:Hayes JR、Groner JI。 「複数の代入および傾向スコアを使用して、外傷登録データからの損傷の重症度に対するカーシートおよびシートベルト使用の影響をテストします。」 J Pediatr Surg。2008 5月; 43(5):924-7。 この研究では、15の完全なデータセットを取得するために複数の代入が実行されました。次に、各データセットの傾向スコアが計算されました。次に、各観測単位について、完成した15個のデータセット(関連する傾向スコアを含む)の1つからレコードがランダムに選択され、傾向スコアマッチングによって分析される単一の最終データセットが作成されました。 私の質問は次のとおりです。これは、複数の代入に続く傾向スコアのマッチングを実行する有効な方法ですか?それを行う別の方法はありますか? コンテキスト:私の新しいプロジェクトでは、傾向スコアマッチングを使用して2つの治療法の効果を比較することを目指しています。欠損データがありMICEます。R のパッケージを使用して欠損値を代入twangし、傾向スコアのマッチングを行い、マッチングlme4したデータを分析します。 アップデート1: 異なるアプローチをとるこの論文を見つけました。Mitra、Robin and Reiter、Jerome P.(2011)反復シーケンシャル多重代入による欠落した共変量との傾向スコアのマッチング[Working Paper] この論文では、著者はすべての帰属データセットの傾向スコアを計算し、平均化によってそれらをプールします。これは、ポイント推定にルービンのルールを使用した多重帰属の精神に基づいていますが、傾向スコアには本当に適用可能ですか? これらの2つの異なるアプローチ、および/または他のアプローチについてのコメントをCVの誰かが提供できれば、本当に素晴らしいでしょう。

5
機械学習で階層/ネストされたデータを処理する方法
例で問題を説明します。いくつかの属性(年齢、性別、国、地域、都市)を与えられた個人の収入を予測するとします。あなたはそのようなトレーニングデータセットを持っています train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3), RegionID=c(1,1,1,2, 3,3,4,4, 5,5,5,5), CityID=c(1,1,2,3, 4,5,6,6, 7,7,7,8), Age=c(23,48,62,63, 25,41,45,19, 37,41,31,50), Gender=factor(c("M","F","M","F", "M","F","M","F", "F","F","F","M")), Income=c(31,42,71,65, 50,51,101,38, 47,50,55,23)) train CountryID RegionID CityID Age Gender Income 1 1 1 1 23 M 31 2 1 1 1 48 F 42 3 1 1 2 62 M 71 4 …
29 regression  machine-learning  multilevel-analysis  correlation  dataset  spatial  paired-comparisons  cross-correlation  clustering  aic  bic  dependent-variable  k-means  mean  standard-error  measurement-error  errors-in-variables  regression  multiple-regression  pca  linear-model  dimensionality-reduction  machine-learning  neural-networks  deep-learning  conv-neural-network  computer-vision  clustering  spss  r  weighted-data  wilcoxon-signed-rank  bayesian  hierarchical-bayesian  bugs  stan  distributions  categorical-data  variance  ecology  r  survival  regression  r-squared  descriptive-statistics  cross-section  maximum-likelihood  factor-analysis  likert  r  multiple-imputation  propensity-scores  distributions  t-test  logit  probit  z-test  confidence-interval  poisson-distribution  deep-learning  conv-neural-network  residual-networks  r  survey  wilcoxon-mann-whitney  ranking  kruskal-wallis  bias  loss-functions  frequentist  decision-theory  risk  machine-learning  distributions  normal-distribution  multivariate-analysis  inference  dataset  factor-analysis  survey  multilevel-analysis  clinical-trials 

5
統計的観点から、観察研究で傾向スコアを使用して因果関係を推測できますか?
質問:統計学者(または開業医)の観点から、観察研究(実験ではなく)で傾向スコアを使用して因果関係を推測できますか? どうか、炎戦争や狂信的な議論を始めたくない。 背景: stat PhDプログラム内では、ワーキンググループといくつかのトピックセッションを通じて、因果推論のみに触れました。ただし、他の部門(HDFS、社会学など)には、それらを積極的に使用している非常に著名な研究者がいます。 私はすでにこの問題についてかなり白熱した議論を目撃しました。ここから開始するつもりはありません。とはいえ、どのような参考文献に遭遇しましたか?どのような視点がありますか?たとえば、因果推論手法としての傾向スコアに対して私が聞いた議論の1つは、変数バイアスが省略されているために因果関係を推測できないことです-重要な何かを省くと、因果連鎖を破ります。これは解決できない問題ですか? 免責事項:この質問には正しい答えがないかもしれません-cwをクリックすることで完全にクールですが、私は個人的に回答に非常に興味があり、実世界の例を含むいくつかの良い参考文献に満足しています。

1
平均治療効果と限界治療効果の違い
私はいくつかの論文を読んできましたが、平均治療効果(ATE)と限界治療効果(MTE)の具体的な定義についてはわかりません。彼らは同じですか? オースティンによると... 条件付き効果は、被験者レベルで、被験者を未治療から治療に移行する平均効果です。多変数回帰モデルからの治療割り当て指標変数の回帰係数は、条件効果または調整効果の推定値です。対照的に、限界効果とは、母集団レベルで、母集団全体を未治療から治療に移行する平均効果です[10]。線形治療効果(平均値の差と比率の差)は折りたたむことができます。条件付き治療効果と限界治療効果は一致します。ただし、結果がバイナリまたは自然発生時間である場合、オッズ比とハザード比は折りたたみ式ではありません[11]。ローゼンバウムは、傾向スコア法により、条件付き効果ではなく、限界効果を推定できることを指摘している[12]。限界治療効果を推定するためのさまざまな傾向スコア法の性能に関する研究が不足しています。 しかし、別のオースティン紙で、彼は言います 各被験者について、治療の効果はと定義されます。平均治療効果(ATE)はと定義されています。(Imbens、2004)。ATEは、母集団レベルで、母集団全体を未治療から治療に移行する平均効果です。Y私(1 )− Y私(0 )Y私(1)−Y私(0)Y_i(1)- Y_i(0)E[ Y私(1 )− Y私(0 )]E[Y私(1)−Y私(0)]E[Y_i(1)- Y_i(0)] だから私が持っている質問は...平均治療効果と限界治療効果の違いは何ですか? また、見積もりをどのように分類すればよいですか?傾向スコア加重(IPTW)Coxモデルがあります。私の唯一の共変量は治療指標です。結果として生じるハザード比は、ATEまたはMTEと見なされるべきですか? 編集:混乱を増すために、Guoは本の傾向スコア分析で、限界治療効果は ...無関心の限界にある人々(EOTM)に対する治療効果の特別なケース。一部の政策および実務の状況では、限界収益と平均収益を区別することが重要です。たとえば、大学に通う平均的な学生は、学校に通うかどうかについて無関心であるわずかな学生よりも良い(すなわち、より高い成績をとる)可能性があります。 これは社会科学(マージナルの定義が異なると思う)に向けられているので、これを一粒の塩でとるべきだと思いますが、私が混乱している理由を示すためにここに含めると思いました。

4
パネルデータと一致する傾向スコア
個人の縦断的なデータセットがあり、その一部は治療の対象であり、他の対象はそうではありませんでした。すべての個人は、出生から18歳までのサンプルに含まれており、治療はその範囲内のある年齢で行われます。治療の年齢は症例によって異なる場合があります。傾向スコアマッチングを使用して、生年の18歳までの各ペアを追跡できるように、生年に完全に一致するペアの治療ユニットとコントロールユニットを一致させたいと思います。マッチング後、アイデアは差異の差の戦略を使用して治療の効果を推定することです。 私が現在直面している問題は、パネルデータとのマッチングを行うことです。Stataのpsmatch2コマンドを使用しており、傾向スコアマッチングを使用して世帯と個人の特性を照合します。一般に、パネルデータでは、年齢ごとに最適な一致が異なります。例として、Aが処理され、BとCがコントロールであり、それらすべてが1980年に生まれた場合、AとBは1980年に0歳で一致し、AとCは1981年に1歳で一致します。 。また、Aは、過去数年間の独自の治療前の値と一致する場合があります。 この問題を回避するために、サンプルの期間全体で平均的に最も類似している個人をマッチングで識別できるように、すべての時変変数の平均を取り、0〜18の年齢グループごとに個別にマッチングを行います。残念ながら、これは依然として、年齢グループごとに異なる制御ユニットを各処理ユニットに一致させます。 誰かがStataのパネルデータとペアワイズマッチングを行う方法に私を導くことができれば、これは非常に高く評価されるでしょう。

4
傾向スコアのマッチングが因果推論に役立つのはなぜですか?
傾向スコアマッチングは、観察研究で因果推論を行うために使用されます(Rosenbaum / Rubinの論文を参照)。それが機能する理由の背後にある単純な直感は何ですか? 言い換えれば、治療に参加する確率が2つのグループで等しくなるようにすると、交絡の影響がなくなり、その結果を使用して治療の因果関係を判断できるのはなぜですか。

1
傾向スコアの重み付けにおける治療の重みの逆確率(IPTW)の直感的な説明?
傾向スコアを使用して重みを計算するメカニズムを理解しています: w i 、j = t r e a tp(xi)p(xi)p(x_i) そして、回帰分析で重みを適用し、重みは、治療および対照群集団における共変量の効果を結果変数と「制御」または分離する働きをします。wi,j=treatwi,j=control=1p(xi)=11−p(xi)wi,j=treat=1p(xi)wi,j=control=11−p(xi)\begin{align} w_{i, j={\rm treat}} &= \frac{1}{p(x_i)} \\[5pt] w_{i, j={\rm control}} &= \frac{1}{1-p(x_i)} \end{align} しかし、腸レベルでは、重みがこれをどのように達成するのか、そしてなぜ方程式がそのままの形で構築されるのか理解できません。

2
Cox PH分析および共変量選択における傾向スコアの重み付け
イベント発生までの時間の生存データのコックス比例ハザードモデリングを行う際の傾向スコアの重み付け(IPTW)について: 私は、ほとんどの場合、患者がベースラインですでに服用していた薬剤の治療効果を調べることに関心がある、予想されるレジストリデータを持っています。したがって、データを最適に分析する方法がわかりません。潜在的に、いくつかのベースライン変数はかなりの程度、治療によって影響され、その逆ではありません(たとえば、特定のバイオマーカー)。重みを推定するための傾向スコアモデルに含める必要がある共変量と、coxphモデルに共変量として含める必要がある共変量(ある場合)について少し迷っています。正しい方向のヒントがあれば役立ちます。現在のところ、CoxPhモデリングでこれに関する文献を見つけることはできません。 ベースラインで開始され、結果に影響を与える可能性のある治療を表す共変量は、Cox PH共変量として含める必要があると考えていますが、これはわかりません。 傾向スコアの重みの計算に使用するのではなく、Coxモデルに共変量として含める必要がある変数をどのように決定しますか? フォローアップの質問: 私は、すでに始まっている特定の介入の治療効果を評価するという相続問題を理解しています。つまり、観察を始める前に、患者に蔓延しています。リスクの時間変動に関連するバイアスの導入(たとえば、治療の最初の年に一般的な有害な副作用)と治療によって影響を受ける共変量の両方について。私が間違っていない場合-これは、心血管エンドポイントとホルモン補充療法に関して、観察と無作為化の間の不一致の原因として提案されています。一方、私のデータセットでは、治療の悪影響の可能性を調べることに関心があります。 傾向スコア調整を使用して、一般的なユーザー間の治療効果を調査する場合、つまり、観察が始まる前にすでに薬物を使用しているコホートデータで、薬物療法の悪影響を観察した場合(これは私たちが探していたものです)。治療に伴うリスクを過大評価する可能性を排除できますか?つまり、リスクが大幅に上昇している限り、それは最も「確実に」防御的ではありませんか? この種のバイアスが、この文脈での偽のリスク関連のリスクの過大評価をもたらす可能性がある例を完全に描くことはできません。

1
傾向スコアの重み付けによる平均治療効果の信頼区間?
傾向スコアの重み付け(具体的にはIPTW)を使用して、観測データから平均治療効果を推定しようとしています。私はATEを正しく計算していると思いますが、逆の傾向スコアの重みを考慮しながら、ATEの信頼区間を計算する方法がわかりません。 以下は、平均治療効果を計算するために使用する方程式です(参照Stat Med。Sep 10、2010; 29(20):2137–2148。): ここで、被験者の総数、治療状態、結果状態、および傾向スコア。ATE=1N∑1NZiYipi−1N∑1N(1−Zi)Yi1−piATE=1N∑1NZiYipi−1N∑1N(1−Zi)Yi1−piATE=\frac1N\sum_1^N\frac{Z_iY_i}{p_i}-\frac1N\sum_1^N\frac{(1-Z_i)Y_i}{1-p_i}N=N=N=Zi=Zi=Z_i=Yi=Yi=Y_i=pi=pi=p_i= 重みを考慮して、平均治療効果の信頼区間を計算するRパッケージを知っている人はいますか?でしたsurveyここでパッケージのヘルプ?これがうまくいくかどうか疑問に思っていました: library(survey) sampsvy=svydesign(id=~1,weights=~iptw,data=df) svyby(~surgery=='lump',~treatment,design=sampsvy,svyciprop,vartype='ci',method='beta') #which produces this result: treatment surgery == "lump" ci_l ci_u No 0.1644043 0.1480568 0.1817876 Yes 0.2433215 0.2262039 0.2610724 比率間の差の信頼区間(平均治療効果など)を見つけるために、ここからどこへ行くべきかわかりません。

4
傾向スコアのすべてを調整しますか?
方法論に関する質問があるため、サンプルデータセットが添付されていません。 特定の薬物が結果のリスクを低減するかどうかを調べることを目的とした、傾向スコア調整済みCox回帰を行う予定です。研究は観察的であり、10,000人の個人を含みます。 データセットには60個の変数が含まれています。これらのうち25が治療の割り当てに影響を与える可能性があると私は判断します。私はCox回帰でこれらすべての25を調整することはありませんが、傾向スコアに予測子としてその多くの変数を含めることができ、Cox回帰には傾向スコアサブクラスと処理変数のみを含めることができると聞きました。 (もちろん、プロップスコア調整後に等しくない共変量は、Cox回帰に含める必要があります)。 結論として、その多くの予測子を小道具スコアに含めるのは本当に賢明ですか? @Dimitriy V. Masterovこれらの重要な事実を共有していただきありがとうございます。他の回帰フレームワークを検討している本や記事とは異なり、傾向スコア分析でのモデル選択に関する(Rosenbaumsの本を読んで)ガイドラインはありません。標準的な教科書やレビュー記事では、常に厳しい変数選択を推奨し、予測子の数を低く抑えているようですが、プロップスコア分析では、このような議論はあまり見ていません。あなたは書く:(1)「理論的洞察、制度的知識、そして良い研究はXの選択を導くべきである」。私は同意しますが、変数が手元にあり、変数が治療の割り当てまたは結果に影響を与えるかどうかが実際にはわからない(しかし可能性がある)状況があります。例:濾過率で測定した腎機能を、スタチン治療の調整を目的とした支柱スコアに含めますか?スタチン治療は腎機能とは何の関係もありません。私はすでにスタチン治療に影響を与える一連の変数を含めました。しかし、それでも腎機能を含めるのは魅力的です。さらに調整される可能性があります。これは結果に影響を与えるので含める必要があると言う人もいますが、私たちが知る限り、治療にも結果にも影響を与えない変数の別の例(バイナリ変数アーバン/ルーラルリビングなど)を挙げます。それが含まれている限り、私はそれを含めたいと思います tプロップスコアの精度に影響します。(2)「治療の影響を受けるXを、治療後または治療を見越して事前に含めると、仮定が無効になります。」ここで何を言っているのかわかりません。しかし、スタチンが心血管転帰に及ぼす影響を研究する場合、傾向脂質に血中脂質のさまざまな測定値を含めます。血中脂質は治療によって影響を受けます。私はこの発言を誤解したと思います。 @statsRusは、事実、特に「入力の選択に関するメモ」と呼んでいるものを共有してくれてありがとう。私もあなたと同じように推論します。 残念ながら、プロップスコアメソッドでは、モデル選択戦略ではなく、さまざまな調整戦略について説明しています。おそらくモデルフィットは重要ではありません。その場合は、結果と治療の割り当てにわずかに影響する可能性のあるすべての変数を調整します。私は統計学者ではありませんが、モデルの適合が重要でない場合は、治療の割り当てと結果に影響を与える可能性のあるすべての変数を調整したいと思います。これは、多くの場合、治療によって影響を受ける変数を含めることを意味します。 さらに、一部の人々は、その後のCox回帰には治療変数とプロップスコアサブクラスのみを含める必要があると示唆しています。他の人は、coxの調整には、調整する他のすべての変数に加えてプロップスコアを含めることを推奨しています。

1
DiD推定を使用する場合の傾向スコアマッチングにおけるATT対ATE
リーとリトル2017によると、傾向スコア(PS)メソッドを使用する場合、オッズの重み付けは治療(ATT)の平均治療効果を生成しますが、サブ分類と治療の逆確率(IPTW)による重み付けを使用すると、サンプル全体の平均処理効果(ATE)で測定される効果。 私は、Difference-in-Difference(DiD)推定がATTを生成すると信じています。私の質問は: DiDでPSメソッドを使用する場合、上記のルールは当てはまりますか? DiDのコンテキストでIPTWによる計量を行うと、効果測定はどうなりますか?ATTかATEか?

3
Rで傾向スコアを一致させた後の結果が異なる
傾向スコアマッチングを実行しました(Rパッケージの「Matchit」を使用してRで)。マッチング方法は「最近傍」を使用しました。マッチング後、結果変数の観点から、治療と対照群を比較しました。この比較には、t検定を使用しました。各マッチング手順の後に、t検定の結果が変化することを発見しました。この結果の変化が傾向スコア(最近傍マッチングに使用される)のランダムな選択によるものであるという私の仮定をテストするために、乱数ジェネレーターを特定のシードに設定し、マッチング手順を数回実行しました。RNGを設定することで、結果に違いがなくなりました。 すべてのマッチング手順の後で異なる結果に直面しました:さらなる分析に使用するマッチングソリューションをどのように決定しますか?マッチング手順を数回(たとえば10'000)実行し、複数のt検定から得られた結果のp値とt値の中央値を報告することは有効な方法ですか?

1
傾向スコア分析で、非常に小さいまたは大きい傾向を処理するためのオプションは何ですか?
\newcommand{\P}{\mathbb{P}}治療の割り当てを非常によく説明できる観測データに関心があります。たとえば、のロジスティック回帰 P(A=1 | X)= (1 + exp(− (Xβ)))− 1P(A=1|X)=(1+exp⁡(−(Xβ)))−1\P(A =1 |X) = (1+ \exp(-(X\beta)))^{-1} wehre あAA治療割り当てとバツXX共変量は、非常に高いテストと非常に良好なフィット感があるA UC> .80AUC>.80AUC >.80、さらには> .90>.90>.90。これは傾向モデルの精度にとって朗報ですが、傾向スコアの推定につながりますπ^=(1 + exp(− (Xβ^)))− 1π^=(1+exp⁡(−(Xβ^)))−1\hat{\pi} = (1+ \exp(-(X \hat{\beta})))^{-1}閉じる000または111。これらは、結果の期待値の逆確率重み付け推定量などの推定量で使用される大きな逆確率重みπ^− 1π^−1\hat{\pi}^{-1}および(1- \ hat {\ pi})^ {-1}につながりますY_1(観察中の観察):(1 − π^)− 1(1−π^)−1(1-\hat{\pi})^{-1}Y1Y1Y_1 ん− 1Σ私π私^− 1あ私Y1 i。n−1∑iπi^−1AiY1i.n^{-1} \sum_i \hat{\pi_i}^{-1} A_i Y_{1i}. これにより、推定値の分散が非常に大きくなると思います。 非常に差別的な傾向スコアモデルが極端な重みにつながるのは悪循環のようです。 私の質問:この分析をより堅牢にするために利用可能なオプションは何ですか?傾向スコアモデルを適合させる代替手段はありますか、またはモデルが適合した後に大きな重みを処理する方法はありますか?

2
時変処理による傾向スコアマッチング
基本的な傾向スコアマッチング手順は、断面データ(つまり、特定の時点で収集されたデータ)で機能します。一般的なpsmatch2コマンドは、観測値が処理グループまたはコントロールグループに属していることを示すダミー変数を使用します。 ただし、私のデータセットでは、このインジケーター関数は時変です。データは次のようになります。個人を特定し、12年間追跡します。この期間のある時点で、個人は治療を受ける可能性があるため、「コントロールから治療グループに移る」。これは、個人ごとにいつでも発生する可能性があることに注意してください(sic!)。 その上、その後の私の分析は時間に依存します:個人が治療されている瞬間から、次の年(シック!)についてのみATTを推定したいと思います。したがって、治療を開始してから1年後には、治療を受けた個人についてはもう気になりません。 psmatch2それに関しては非常に制限的なようです。それを行う方法について何か可能性がありますか?多分それを可能にするマッチング方法もあります。 PS:フォーラムには同様の質問が1つありますが、この問題の解決には役立ちませんでした。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.