タグ付けされた質問 「observational-study」

2
重回帰は共変量を実際に「制御」できますか?
私たちはすべて、考えられるすべての潜在的な交絡因子を重回帰モデルに含めることで、非ランダム化予測子Xと結果の間の因果リンクを確立しようとする観察研究に精通しています。このように、すべての交絡因子を「制御する」ことにより、関心のある予測子の効果を分離します。 主に私の統計学のクラスのさまざまな教授によって行われたオフハンドの発言に基づいて、私はこの考えにますます不快感を抱いています。それらはいくつかの主要なカテゴリーに分類されます。 1.考え、測定する共変量のみを制御できます。 これは明らかですが、実際に最も有害で乗り越えられないものなのでしょうか。 2.このアプローチは、過去にugい間違いを引き起こしました。 たとえば、Petitti&Freedman(2005)は、何十年にもわたって統計的に調整された観察研究が、心臓病のリスクに対するホルモン補充療法の効果に関する悲惨な誤った結論に至った経緯について議論しています。後のRCTでは、ほぼ逆の効果が見つかりました。 3.予測変数と結果の関係は、共変量を制御すると奇妙に動作する可能性があります。 Yu-Kang Tu、Gunnell、&Gilthorpe(2008) は、主のパラドックス、シンプソンのパラドックス、サプレッサー変数など、いくつかの異なる症状を議論しています。 4.単一モデル(重回帰)で共変量を適切に調整し、同時に予測結果の関係をモデル化することは困難です。 傾向スコアや交絡因子の層別化などの方法の優位性の理由としてこれを聞いたことがありますが、本当にそれを理解しているかはわかりません。 5. ANCOVAモデルでは、対象の共変量と予測子が独立している必要があります。 もちろん、対象の予測変数と相関しているため、交絡因子を正確に調整します。したがって、モデルは、必要なときに正確なインスタンスで失敗するようです。議論は、調整はランダム化試験でのノイズ低減にのみ適しているということです。Miller&Chapman、2001年は素晴らしいレビューを与えます。 だから私の質問は: これらの問題や私が知らないその他の問題はどれほど深刻ですか? 「すべてをコントロールする」研究を見たとき、私はどれほど恐れるべきでしょうか? (この質問が議論の領域にあまり深く入り込んでいないことを望み、それを改善するための提案を喜んで誘います。) 編集:新しい参照を見つけた後、ポイント5を追加しました。

2
心理学の観察研究を分析するために構造方程式モデリングを使用するかどうか
統計コンサルティングの設定でこの問題が頻繁に発生していることに気付きました。あなたの考えを聞きたいと思いました。 コンテキスト 私は、次のような研究を行った研究生とよく話します。 観察研究 サンプルサイズは100、200、300などです。 複数の心理的尺度が測定されている(たとえば、不安、抑うつ、性格、態度、他の臨床的尺度、おそらく知性など) 研究者は関連する文献を読み、考えられる原因プロセスについていくつかの考えを持っています。多くの場合、前件、プロセス変数、および結果変数への変数の一般的な概念化があります。彼らはまた、構造方程式モデリングが、研究している一連の変数間の関係の全体的なモデルをテストするのにより適しているとよく耳にしました。 質問 どのような条件下で、構造方程式モデリングがそのような研究を分析するための適切な手法だと思いますか? 構造方程式モデリングを推奨しない場合、どのような代替手法を推奨しますか? そのような場合に構造方程式モデリングを使用することを検討している研究者にどのようなアドバイスをしますか?

2
機器がない場合の観測データのモデルについて、私たちは何と言えますか?
過去に、観測データ(つまり、制御された実験によって生成されなかったデータ)に回帰(およびパネルモデルやGLMなどの関連モデル)が使用されている多くの分野で、公開された論文に関して質問されてきました。 、多くの場合-常にではありませんが-データは時間の経過とともに観測されますが、計測変数を導入する試みは行われません。 私はいくつかの批判をしました(たとえば、重要な変数が欠落している可能性のあるバイアスの問題について説明するなど)が、ここにいる他の人はこのトピックについて私よりもはるかに知識があるので、私は尋ねると思いました: そのような状況で、関係について結論を出そうとすることの主な問題/結果(特に、因果的な結論に限定されない)は何ですか? 機器がない場合にこのようなモデルに適合する研究で、何か役立つことはありますか? そのようなモデリングに関する問題についての良い参考文献(本または論文)は何ですか(多くの場合、質問する人はさまざまな背景を持っているため、多くの統計がないものもあるため、批評で参照する可能性があります)紙?器具に関する注意/問題についての議論も有用でしょう。 (インストゥルメンタル変数に関する基本的なリファレンスはここにありますが、そこに追加するものがあれば、それも役立ちます。) 楽器を見つけて使用するための良い実用的な例へのポインタはおまけですが、この質問の中心ではありません。 [このような質問が出てきたら、ここで他の人に良い答えを指摘するでしょう。入手したら1つまたは2つの例を追加できます。]

1
傾向スコアの重み付けによる平均治療効果の信頼区間?
傾向スコアの重み付け(具体的にはIPTW)を使用して、観測データから平均治療効果を推定しようとしています。私はATEを正しく計算していると思いますが、逆の傾向スコアの重みを考慮しながら、ATEの信頼区間を計算する方法がわかりません。 以下は、平均治療効果を計算するために使用する方程式です(参照Stat Med。Sep 10、2010; 29(20):2137–2148。): ここで、被験者の総数、治療状態、結果状態、および傾向スコア。ATE=1N∑1NZiYipi−1N∑1N(1−Zi)Yi1−piATE=1N∑1NZiYipi−1N∑1N(1−Zi)Yi1−piATE=\frac1N\sum_1^N\frac{Z_iY_i}{p_i}-\frac1N\sum_1^N\frac{(1-Z_i)Y_i}{1-p_i}N=N=N=Zi=Zi=Z_i=Yi=Yi=Y_i=pi=pi=p_i= 重みを考慮して、平均治療効果の信頼区間を計算するRパッケージを知っている人はいますか?でしたsurveyここでパッケージのヘルプ?これがうまくいくかどうか疑問に思っていました: library(survey) sampsvy=svydesign(id=~1,weights=~iptw,data=df) svyby(~surgery=='lump',~treatment,design=sampsvy,svyciprop,vartype='ci',method='beta') #which produces this result: treatment surgery == "lump" ci_l ci_u No 0.1644043 0.1480568 0.1817876 Yes 0.2433215 0.2262039 0.2610724 比率間の差の信頼区間(平均治療効果など)を見つけるために、ここからどこへ行くべきかわかりません。

3
SVDを実行して欠損値を代入する方法、具体例
SVDを適用する前に欠損値を処理する方法に関する素晴らしいコメントを読みましたが、簡単な例でどのように機能するか知りたいです。 Movie1 Movie2 Movie3 User1 5 4 User2 2 5 5 User3 3 4 User4 1 5 User5 5 1 5 上記のマトリックスを考えると、NAの値を削除すると、User2とUser5しかなくなります。これは、私のUが2×kになることを意味します。しかし、欠損値を予測する場合、Uは5×kである必要があります。これは、特異値とVで乗算できます。 上記のマトリックスで、最初に欠損値のあるユーザーを削除してからSVDを適用して、欠損値を記入する人はいますか?数学記号を使いすぎずに、適用した手順の非常に簡単な説明を提供し、答えを実用的なものにしてください(つまり、数値に別の数値を掛けると答えが得られます)。 次のリンクを読みました。 stats.stackexchange.com/q/33142 stats.stackexchange.com/q/31096 stats.stackexchange.com/q/33103
8 r  missing-data  data-imputation  svd  sampling  matlab  mcmc  importance-sampling  predictive-models  prediction  algorithms  graphical-model  graph-theory  r  regression  regression-coefficients  r-squared  r  regression  modeling  confounding  residuals  fitting  glmm  zero-inflation  overdispersion  optimization  curve-fitting  regression  time-series  order-statistics  bayesian  prior  uninformative-prior  probability  discrete-data  kolmogorov-smirnov  r  data-visualization  histogram  dimensionality-reduction  classification  clustering  accuracy  semi-supervised  labeling  state-space-models  t-test  biostatistics  paired-comparisons  paired-data  bioinformatics  regression  logistic  multiple-regression  mixed-model  random-effects-model  neural-networks  error-propagation  numerical-integration  time-series  missing-data  data-imputation  probability  self-study  combinatorics  survival  cox-model  statistical-significance  wilcoxon-mann-whitney  hypothesis-testing  distributions  normal-distribution  variance  t-distribution  probability  simulation  random-walk  diffusion  hypothesis-testing  z-test  hypothesis-testing  data-transformation  lognormal  r  regression  agreement-statistics  classification  svm  mixed-model  non-independent  observational-study  goodness-of-fit  residuals  confirmatory-factor  neural-networks  deep-learning 

1
ロジスティックモデリングのコンテキストで「ケースコントロール」と「横断的」とはどういう意味ですか?
ロジスティックモデリングを研究しているときに、次のステートメントを読みました ケースコントロールまたは横断研究のロジスティックモデリングから、オッズ比のみが推定され、個々のリスクは推定されないという事実は驚くべきことではありません。 「ケースコントロール」と「横断研究」が統計分析で何を表すのかわかりません。また、統計分析の観点から、上記の意味がよくわかりません。説明をいただければ幸いです。
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.