タグ付けされた質問 「causality」

原因と結果の関係。

1
どの因果関係の理論を知っておくべきですか?
応用統計学者/計量経済学者として、因果関係に対するどの理論的アプローチを知るべきですか? 私は知っています(ほんの少し) Neyman-Rubin因果モデル(およびRoy、Haavelmoなど) 因果関係に関するパールの研究 グレンジャー因果関係(ただし、治療志向性は低い) どのコンセプトを見逃しているか、または知っておくべきですか? 関連:機械学習の因果関係の基礎となる理論はどれですか? 私は、これらの興味深い質問と回答(読んだことが1、2、3)が、私は別の質問だと思います。また、たとえば、「因果関係」が統計学習の要素で言及されていないことに驚いた。

1
Granger因果関係テストの結果の解釈
私はグレンジャーの因果関係について自分自身を教育しようとしています。このサイトの投稿といくつかの優れた記事をオンラインで読みました。また、非常に便利なツールである二変量グレンジャー因果-無料統計計算機に出会いました。このツールを使用すると、時系列を入力してグレンジャー統計を計算できます。以下は、サイトに含まれるサンプルデータの出力です。また、結果の解釈に亀裂を入れました。 私の質問: 私の解釈は方向的に正しいですか? 見落としている重要な洞察は何ですか? また、CCFチャートの意味と解釈は何ですか?(CCFは相互相関であると仮定しています。) 私が解釈した結果とプロットは次のとおりです。 Summary of computational transaction Raw Input view raw input (R code) Raw Output view raw output of R engine Computing time 2 seconds R Server 'Herman Ole Andreas Wold' @ wold.wessa.net Granger Causality Test: Y = f(X) Model Res.DF Diff. DF F p-value Complete …

4
勾配ブースティングマシンの精度は、反復回数が増えると低下します
caretR のパッケージを介して勾配ブースティングマシンアルゴリズムを試しています。 小さな大学入学データセットを使用して、次のコードを実行しました。 library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- "yes" ### Gradient boosting machine algorithm. ### set.seed(123) fitControl <- trainControl(method = 'cv', number = 5, summaryFunction=defaultSummary) grid <- expand.grid(n.trees = seq(5000,1000000,5000), interaction.depth = 2, shrinkage …
15 machine-learning  caret  boosting  gbm  hypothesis-testing  t-test  panel-data  psychometrics  intraclass-correlation  generalized-linear-model  categorical-data  binomial  model  intercept  causality  cross-correlation  distributions  ranks  p-value  z-test  sign-test  time-series  references  terminology  cross-correlation  definition  probability  distributions  beta-distribution  inverse-gamma  missing-data  paired-comparisons  paired-data  clustered-standard-errors  cluster-sample  time-series  arima  logistic  binary-data  odds-ratio  medicine  hypothesis-testing  wilcoxon-mann-whitney  unsupervised-learning  hierarchical-clustering  neural-networks  train  clustering  k-means  regression  ordinal-data  change-scores  machine-learning  experiment-design  roc  precision-recall  auc  stata  multilevel-analysis  regression  fitting  nonlinear  jmp  r  data-visualization  gam  gamm4  r  lme4-nlme  many-categories  regression  causality  instrumental-variables  endogeneity  controlling-for-a-variable 

3
因果的ベイジアンネットワークにおけるd分離理論の理解
因果ベイジアンネットワークのd分離ロジックを理解しようとしています。アルゴリズムがどのように機能するかは知っていますが、アルゴリズムで述べられているように「情報の流れ」が機能する理由を正確には理解していません。 たとえば、上記のグラフでは、Xのみが与えられ、他の変数は観測されていないと考えてみましょう。次に、d分離の規則に従って、XからDへの情報の流れ: Xは、であるAに影響します。AはXを引き起こし、効果Xを知っている場合、これは原因Aの信念に影響を与えるため、これは問題ありません。情報フロー。P(A)≠P(A|X)P(A)≠P(A|X)P(A)\neq P(A|X) XはBに影響を与えます。これはです。これは問題ありません。AはXに関する知識によって変更されているため、Aでの変更は、その原因であるBについての私たちの信念にも影響を与える可能性があります。P(B)≠P(B|X)P(B)≠P(B|X)P(B)\neq P(B|X) XはCに影響を与えます。これはです。これは問題ありません。なぜなら、Bはその間接効果Xに関する知識によってバイアスされていることを知っているからです。CはBの直接的な効果であり、Xに関する知識の影響を受けます。P(C)≠P(C|X)P(C)≠P(C|X)P(C)\neq P(C|X) さて、この時点まで、情報の流れは直感的な因果関係に従って発生するため、すべてが問題ありません。しかし、このスキームでは、いわゆる「V構造」や「コライダー」の特別な動作は得られません。d-Separation理論によれば、BとDは上のグラフのCの一般的な原因であり、Cまたはその子孫を観察しなかった場合、Xからのフロー情報はCでブロックされます。 、しかし私の質問はなぜですか? Xから開始した上記の3つのステップから、CはXに関する知識の影響を受け、情報フローは原因と結果の関係に従って発生することがわかりました。d-分離理論では、Cは観測されないため、CからDに進むことはできないとされています。しかし、私はCが偏っていてDがCの原因であることを知っているので、理論は反対のことを言いながらDも影響を受けるべきだと思います。私の思考パターンには明らかに何かが欠けていますが、それが何であるかを見ることができません。 したがって、Cが観察されない場合、Cで情報の流れがブロックされる理由の説明が必要です。


1
平均治療効果と限界治療効果の違い
私はいくつかの論文を読んできましたが、平均治療効果(ATE)と限界治療効果(MTE)の具体的な定義についてはわかりません。彼らは同じですか? オースティンによると... 条件付き効果は、被験者レベルで、被験者を未治療から治療に移行する平均効果です。多変数回帰モデルからの治療割り当て指標変数の回帰係数は、条件効果または調整効果の推定値です。対照的に、限界効果とは、母集団レベルで、母集団全体を未治療から治療に移行する平均効果です[10]。線形治療効果(平均値の差と比率の差)は折りたたむことができます。条件付き治療効果と限界治療効果は一致します。ただし、結果がバイナリまたは自然発生時間である場合、オッズ比とハザード比は折りたたみ式ではありません[11]。ローゼンバウムは、傾向スコア法により、条件付き効果ではなく、限界効果を推定できることを指摘している[12]。限界治療効果を推定するためのさまざまな傾向スコア法の性能に関する研究が不足しています。 しかし、別のオースティン紙で、彼は言います 各被験者について、治療の効果はと定義されます。平均治療効果(ATE)はと定義されています。(Imbens、2004)。ATEは、母集団レベルで、母集団全体を未治療から治療に移行する平均効果です。Y私(1 )− Y私(0 )Y私(1)−Y私(0)Y_i(1)- Y_i(0)E[ Y私(1 )− Y私(0 )]E[Y私(1)−Y私(0)]E[Y_i(1)- Y_i(0)] だから私が持っている質問は...平均治療効果と限界治療効果の違いは何ですか? また、見積もりをどのように分類すればよいですか?傾向スコア加重(IPTW)Coxモデルがあります。私の唯一の共変量は治療指標です。結果として生じるハザード比は、ATEまたはMTEと見なされるべきですか? 編集:混乱を増すために、Guoは本の傾向スコア分析で、限界治療効果は ...無関心の限界にある人々(EOTM)に対する治療効果の特別なケース。一部の政策および実務の状況では、限界収益と平均収益を区別することが重要です。たとえば、大学に通う平均的な学生は、学校に通うかどうかについて無関心であるわずかな学生よりも良い(すなわち、より高い成績をとる)可能性があります。 これは社会科学(マージナルの定義が異なると思う)に向けられているので、これを一粒の塩でとるべきだと思いますが、私が混乱している理由を示すためにここに含めると思いました。

1
交絡因子-定義
M. Katzの著書「多変量解析」(6ページのセクション1.2)で、「交絡因子はリスク要因に関連し、結果に因果関係があります。」なぜ交絡因子は結果に因果関係があるのでしょうか?交絡因子が結果に関連付けられれば十分ですか?

6
条件「B」に対する治療「A」の利点を決定する際の有効性と有効性の違いは何ですか?
この質問のコンテキストは、健康の枠組み内、つまり、状態の治療における1つまたは複数の治療法を見ることです。尊敬されている研究者でさえ、用語「有効性」と「有効性」を混同しているようです。 混乱を取り除くのに役立つ方法で、有効性と有効性をどのように考えることができますか? 両方のタイプの結果を決定するのに、どのタイプの研究デザインが最も適切でしょうか? 信頼できる雑誌の出版物、書籍、またはウェブ辞書はありますか?

2
do(x)演算子の意味?
私は因果関係で行っている文献レビューのどこでも演算子を見ました例えば、このウィキペディアのエントリを参照)。ただし、この演算子の正式で一般的な定義は見つかりません。do(x)do(x)do(x) 誰かがこれについての良い参照を教えてくれますか?特定の実験での解釈よりも、一般的な定義に興味があります。

4
多変量回帰の前の単変量回帰のポイントは何ですか?
私は現在、小さなデータセットがあり、結果に対する治療の因果関係の影響に関心がある問題に取り組んでいます。 アドバイザーは、結果を応答として、次に治療割り当てを応答として、各予測変数に対して単変量回帰を実行するように指示しました。つまり、回帰を一度に1つの変数に適合させ、結果の表を作成するように求められています。私は「なぜこれを行うべきなのか」と尋ねましたが、答えは「どの予測因子が治療の割り当てと結果に関連しているかに興味があります。私の顧問は訓練を受けた統計学者であり、異なる分野の科学者ではないので、私は彼らを信頼したいと思っています。 これは理にかなっていますが、単変量解析の結果を使用する方法は明確ではありません。これからモデル選択を選択すると、推定値に大きなバイアスがかかり、信頼区間が狭くなりませんか?なぜこれを行う必要がありますか?私は混乱しており、私のアドバイザーは問題を提起したときにこの問題についてかなり不透明です。このテクニックに関するリソースはありますか? (注意:私のアドバイザーは、p値をカットオフとして使用していないが、「すべて」を考慮したいと言っています。)

2
省略された変数がない場合、回帰は原因ですか?
と両方に影響を及ぼす変数が省略されている場合、でのの回帰は因果関係である必要はありません。しかし、省略された変数と測定誤差がない場合、回帰は原因ですか?つまり、すべての可能な変数が回帰に含まれている場合はどうでしょうか?yyyバツバツxバツバツxyyy

2
時系列計量経済学における微計量経済学の因果関係とグレンジャー因果関係
ミクロ経済学(特にIVまたは回帰の不連続性の設計)で使用される因果関係と、時系列計量経済学で使用されるグレンジャーの因果関係を理解しています。どうやって相互に関連付けるのですか?たとえば、パネルデータに両方のアプローチが使用されているのを見ました(たとえば、T = 20)。この点に関する論文への参照は歓迎されます。N=30N=30N=30T=20T=20T=20

4
有向非巡回グラフのエッジは因果関係を表していますか?
私は、自習用の本である確率的グラフィカルモデルを研究しています。有向非巡回グラフ(DAG)のエッジは因果関係を表しますか? ベイジアンネットワークを構築したいのですが、その中の矢印の方向がわかりませんか?すべてのデータは、それらの相互リンクではなく、観測された相関関係を教えてくれます。次の章がこれらの問題に対処することを確信しているので、私は私があまりにも多くを求めていることを知っていますが、それについて考えることをやめられないというだけです。

4
傾向スコアのマッチングが因果推論に役立つのはなぜですか?
傾向スコアマッチングは、観察研究で因果推論を行うために使用されます(Rosenbaum / Rubinの論文を参照)。それが機能する理由の背後にある単純な直感は何ですか? 言い換えれば、治療に参加する確率が2つのグループで等しくなるようにすると、交絡の影響がなくなり、その結果を使用して治療の因果関係を判断できるのはなぜですか。

2
はしごのラング2と3の違い
ユダヤ・パールの「なぜの本」で、彼は「はしごの因果関係」と呼んでいるものについて話しています。最も低いのは観測されたデータの関連性パターン(例、相関、条件付き確率など)、次は介入に焦点を当てています(データ生成プロセスを事前に指定された方法で意図的に変更するとどうなりますか?)。反事実的(何かが起こったか、起こらなかった場合、別の可能な世界で何が起こるか)? 私が理解していないのは、ラング2とラング3の違いです。反事実的な質問をする場合 、観察された世界のある側面を否定するために介入することについて単に質問するのではありませんか?
12 causality 

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.