タグ付けされた質問 「causality」

原因と結果の関係。


1
バックドアとフロントドアの調整による因果関係
以下の因果関係グラフでに対するの因果関係の影響を計算する場合は、バックドア調整とフロントドア調整の定理の両方を使用できます。つまり、 Y P (y | do(X = x ))= ∑ u P (y | x 、u )P (u )バツXXYYYP(y| する(X= x ))= ∑あなたP(y| x、u)P(u )P(y|do(X=x))=∑uP(y|x,u)P(u)P(y | \textit{do}(X = x)) = \sum_u P(y | x, u) P(u) そして P(y| する(X= x ))= ∑zP(z| x) ∑バツ』P(y| バツ』、z)P(x』)。P(y|do(X=x))=∑zP(z|x)∑x′P(y|x′,z)P(x′).P(y | \textit{do}(X = x)) = …

1
バックドアとフロントドアの調整の違いについての素人の理解
ここでは、バックドア調整とフロントドア調整について言及しています。 バックドア調整:統計における典型的な疫学的問題は、測定された交絡因子の影響を調整することです。パールの裏口基準はこの考えを一般化したものです。 正面ドアの調整:一部の変数が観察されない場合、原因の影響を特定するために他の方法に頼る必要があるかもしれません。 このページには、上記の2つの用語の正確な数学的定義も含まれています。 上記の数学的定義に基づいて、素人にバックドア調整とフロントドア調整の違いをどのように理解させるのですか?
12 causality  dag 

2
長期的な変化を推測/予測するために断面データを使用するのはなぜ悪いことですか?
存在することを望んでいる論文を探していますが、存在するかどうかはわかりません。横断的データを使用して長期的な変化を推測/予測することが悪いことである可能性がある理由について、ケーススタディのセット、および/または確率論からの議論である可能性があります(つまり、必ずしもそうではないかもしれませんが)。 私はいくつかの大きな間違いがあったのを見てきました。イギリスの裕福な人々は旅行するため、社会が豊かになるにつれて、人口は全体としてより多く旅行するという推論がなされました。その推論は、10年以上の長期間にわたって真実ではないことが判明しました。そして、国内の電力使用と同様のパターン:横断的なデータは、時間とともに明らかにならない、収入の大幅な増加を意味します。 コホート効果やサプライサイドの制約など、いくつかのことが起こっています。 そのようなケーススタディをまとめた単一のリファレンスがあると非常に便利です。および/または確率理論を使用して、横断データを使用して長期的な変化を推論/予測することが非常に誤解を招く可能性がある理由を説明する そのような論文は存在しますか、ある場合、それは何ですか?

4
OLSで省略された変数バイアスのテストはありますか?
非線形の依存関係を検出する可能性があるラムジーリセットテストを知っています。ただし、回帰係数の1つ(単に線形依存関係)を捨てただけの場合、相関関係によってはバイアスがかかる可能性があります。これは明らかにリセットテストでは検出されません。 このケースのテストは見つかりませんでしたが、「潜在的な省略された変数を含めることを除いて、OVBをテストすることはできません」というステートメントです。それはおそらく理にかなった陳述でしょうね。

2
楽器と変数の因果関係の方向性は重要ですか?
因果律に関する楽器変数の標準的なスキーム(->)は次のとおりです。 Z -> X -> Y ここで、Zは機器、Xは内生変数、Yは応答です。 次の関係は可能ですか? Z <- X ->Y Z <-> X ->Y も有効ですか? インストゥルメントと変数の間の相関は満たされますが、そのような場合の除外制限はどのように考えることができますか? 注:表記<->は明確ではなく、問題の異なる理解につながる可能性があります。それでも、回答はこの問題を強調し、それを使用して問題の重要な側面を示しています。読むときは、質問のこの部分について注意して進めてください。

1
機器変数は選択バイアスにどのように対処しますか?
インストルメンタル変数が回帰の選択バイアスにどのように対処するのかと思います。 ここに私が噛んでいる例があります:ほぼ無害な計量経済学で、著者は兵役と人生の後期の収入に関連するIV回帰について議論します。問題は、「軍での奉仕は将来の収入を増加または減少させるか」ということです。彼らはベトナム戦争の文脈でこの質問を調査します。私は兵役を無作為に割り当てることはできず、これは因果推論の問題であることを理解しています。 この問題に対処するために、研究者は実際の兵役の手段として適格性のドラフト(「ドラフト番号が呼び出される」など)を使用します。それは理にかなっています:ベトナムのドラフトはランダムに若いアメリカ人男性を軍隊に割り当てました(理論的には、ドラフトが実際に私の質問に触れたかどうか)。私たちの他のIV条件はしっかりしているようです。適格草案と実際の兵役は強く、正の相関があります。 これが私の質問です。自己選択のバイアスがかかるようです。たぶん、より裕福な子供たちは、彼らのドラフト番号が呼び出されたとしても、ベトナムでの奉仕から抜け出すことができます。(それが実際に当てはまらない場合は、私の質問のためにふりをしましょう)。この自己選択によりサンプル内にシステムバイアスが生じる場合、計測変数はこのバイアスにどのように対処しますか?推論の範囲を「ドラフトから逃れられなかった人々のタイプ」に狭める必要がありますか?それともIVはどういうわけか私たちの推論のその部分を救いますか?これがどのように機能するかを誰かが説明できれば、私は非常に感謝します。

2
ルービンの因果モデルにおける混乱のなさ-レイマンの説明
ルービンの因果モデルを実装する場合、私たちが必要とする(テストできない)仮定の1つは、混乱しないことです。つまり、 (Y(0 )、Y(1 ))⊥ T| バツ(Y(0),Y(1))⊥T|X(Y(0),Y(1))\perp T|X LHSが反事実である場合、Tは治療であり、Xは私たちが制御する共変量です。 ルービン因果モデルについてあまり知らない人に、これをどのように説明するのかと思います。理論的にはこの仮定が必要な理由は理解していますが、なぜこれが重要なのかは概念的にはわかりません。具体的には、Tが治療である場合、潜在的な結果は治療に大きく依存するのではないでしょうか。同様に、無作為化比較試験がある場合、自動的にます。なぜこれが成り立つのですか?(Y(0 )、Y(1 ))⊥ T(Y(0),Y(1))⊥T(Y(0),Y(1))\perp T RCMを研究していない誰かに、無制限/無視可能性の仮定をどのように説明しますか?

4
因果推論のための因果関係の哲学のためのオンラインリソース
疫学者/生物統計学者が因果関係/因果推論の哲学について学ぶのに興味深く、役立つ本、記事、エッセイ、オンラインチュートリアル/コースなどを推薦できますか? 私はエピとバイオスタットのフレームワークから実際に因果関係を推論することについてはかなり知っていますが、この作業の根底にある動機となる哲学について何か学びたいと思います。たとえば、ヒュームが最初に反事実として解釈される可能性のあるアイデアについて話したことは私の理解です。 私は基本的に哲学についてのトレーニングや経験はないので、最初に比較的紹介的なものが必要ですが、より複雑であるが重要/基礎となるテキスト/著者の推奨事項にも興味があります(ただし、紹介ではないことを示してください)。 これがクロスバリデーションのトピックから外れていないことを願っていますが、皆さんの何人かが以前に私と同じボートに乗っていて、お気に入りのリソースを共有できることを願っています。

4
データ内の因果関係をどのように見つけますか?
「A」、「B」の列を持つテーブルがあるとしましょう 「A」が「B」を引き起こすかどうかを判断する統計的方法はありますか?次の理由により、ピアソンのrを実際に使用することはできません。 値間の相関関係のみをテストします 相関は因果関係ではありません ピアソンのrは線形関係のみを相関させることができます では、他にどのようなオプションがありますか?

2
Judea Pearl Bookの因果関係の問題
統計の因果推論、ジュデア・パールらによる入門書を読み始めています。al。私は数学の修士号を持っていますが、統計学のコースを受講したことはありません。私は初期の研究の質問の1つに少し戸惑っています。それについて質問できる人はいないので、このサイトの誰かが私の答えを批評してくれることを期待しています。(これは宿題の問題ではありません。私は退職者であり、私の心をアクティブに保ちます。)問題には特定のデータが与えられていないことに注意してください。 a)腎臓結石には、治療Aと治療Bの2つの治療法があります。医師は、大きな(したがってより重度の)石に治療Aを処方し、小さな石に治療Bを処方する可能性が高くなります。自分の石のサイズがわからない患者は、一般的な母集団のデータ、またはどの治療法がより効果的かを判断するときにサイズ固有のデータを調べる必要がありますか? b)小さな町に2人の医者がいる。それぞれが彼のキャリアの中で100の手術を行いました。それは2つのタイプです:1つは非常に簡単な手術と1つは非常に難しい手術です。最初の医師は困難な手術よりもはるかに頻繁に簡単な手術を行い、2番目の医師は簡単な手術よりも頻繁に困難な手術を行います。あなたは手術が必要ですが、あなたのケースが簡単か難しいかは分かりません。すべてのケースで各医師の成功率を調べるべきですか、それとも簡単なケースと難しいケースの成功率を別々に調べるべきですか? パートa)については、治療Bと比較して治療Aに欠点があると想定するのは理にかなっています。ですから、私の腎臓結石のサイズを知らないと、私はインテリジェントな決定を下すことができないように思えます。私は、データが治療Aが大きな石に対してより効果的であり、少なくとも小さな石に対して同様に効果的であることを示すと予想しますが、私の石が小さい場合、治療Aの推定リスクを想定したくありません。小さな石でもほぼ正常に治療できると仮定すると、治療Bの方が一般集団で成功率が高くなると予想しますが、大きな石がある場合は治療Bを採用したくありません。 石のサイズが分からない限り、データは役に立たないようです。これはおそらく質問に対する答えですか?私は薬局に行ってどちらの治療薬も店頭で購入することができないので、全体はかなり無意味に思えます。私の医者がそれを処方し、彼が石のサイズを教えてくれない(または言わない)場合、私は医者を変えます。 パートb)については、手順のレートを個別に確認する必要があることは明らかですが、レートだけでは十分ではありません。最初の医師が困難な手術を1回だけ行い、成功したとします。2番目の医師が37回、35回成功しました。私は2番目の医師と一緒に行きたいと思いますが、37点中35点を国の基準と比較したいです。彼がひどく飲み始めた後)。 この種の議論は問題によって要求されているものですか、それともよりカットアンドドライな答えが期待されていますか?インストラクターにこれを読んでもらえるのが幸運だったら、私の答えをどのように採点しますか
11 causality 

2
シンプソンのパラドックスは、隠し変数からの反転のすべてのインスタンスをカバーしていますか?
以下は、シンプソンのパラドックスの存在の「証明」として提供されている多くの視覚化についての質問であり、用語についての質問かもしれません。 シンプソンのパラドックスは説明すると、(理由の数値例を与えるためにかなり単純な現象であり、なぜこの現象が発生することができますが深いと面白いですが)。パラドックスは、2x2x2の分割表(Agresti、Categorical Data Analysis)が存在し、マージナルアソシエーションが各条件付きアソシエーションとは異なる方向にあることです。 つまり、2つの部分母集団の比率の比較はどちらも一方向に進むことができますが、組み合わせた母集団の比較は他の方向に進みます。シンボル: 存在、B 、C 、D 、E 、F 、Gは、Hよう +のBa 、b 、c 、d、e 、f、g、ha,b,c,d,e,f,g,ha,b,c,d,e,f,g,ha + bc + d&gt; e + fg+ ha+bc+d&gt;e+fg+h \frac{a+b}{c+d} > \frac{e+f}{g+h} しかし とac&lt; egac&lt;eg \frac{a}{c} < \frac{e}{g} bd&lt; fhbd&lt;fh \frac{b}{d} < \frac{f}{h} これは、次の視覚化で正確に表現されています(Wikipediaから): 分数は単に対応するベクトルの勾配であり、短いBベクトルは対応するLベクトルよりも大きい勾配を持っていますが、結合されたBベクトルは結合されたLベクトルよりも小さい勾配を持っていることが例でわかります。 多くの形式で非常に一般的な視覚化があり、特にSimpson'sに関するWikipediaのリファレンスの前に1つあります。 これは交絡の良い例であり、(2つのサブ母集団を分離する)非表示変数が異なるパターンを示す方法です。 ただし、数学的には、そのような画像は、シンプソンのパラドックスとして知られている現象の基礎となっている分割表の表示にまったく対応していません。まず、回帰直線は実数値のポイントセットデータ上にあり、分割表のカウントデータではありません。 また、回帰直線で勾配の任意の関係を持つデータセットを作成することもできますが、分割表では、勾配の違いに制限があります。つまり、母集団の回帰直線は、指定された部分母集団のすべての回帰に直交する可能性があります。しかし、シンプソンズのパラドックスでは、サブグループの比率は、回帰勾配ではありませんが、逆の方向にあったとしても、融合した母集団から遠く離れることはできません(ここでも、ウィキペディアの比率比較画像を参照してください)。 私にとっては、シンプソンのパラドックスの視覚化として後者の画像を見るたびに驚かされるのに十分です。しかし、私はどこでも(私が間違っていると思う)例を目にしているので、知りたいと思っています。 オリジナルのシンプソン/ユールの分割表の例から、回帰直線の視覚化を正当化する実際の値への微妙な変換が欠けていますか? 確かにシンプソンズは交絡エラーの特定のインスタンスです。「シンプソンのパラドックス」という用語は交絡エラーと同等になりました。そのため、どのような計算でも、隠し変数を介した方向の変化はシンプソンのパラドックスと呼ばれますか? 補遺:これは、2xmxn(または連続で2 x m)テーブルへの一般化の例です。 …

1
openMxを使用した一卵性双生児と兄弟双生児のSEM概念モデルでのパスの重みの選択
SEMモデルの指定と適合の方法を学ぶために、遺伝疫学分析のためにRパッケージOpenMxをレビューしています。私はこれが初めてなので、我慢してください。OpenMxユーザーガイドの 59ページの例に従っています。ここでは、次の概念モデルを描画します。 そして、パスを指定する際に、潜在的な「1」ノードの重みを顕在化したbmiノード「T1」と「T2」に0.6に設定しました。 関心のある主なパスは、各潜在変数からそれぞれの観測変数へのパスです。これらも推定され(したがって、すべて解放されます)、0.6の開始値と適切なラベルを取得します。 # path coefficients for twin 1 mxPath( from=c("A1","C1","E1"), to="bmi1", arrows=1, free=TRUE, values=0.6, label=c("a","c","e") ), # path coefficients for twin 2 mxPath( from=c("A2","C2","E2"), to="bmi2", arrows=1, free=TRUE, values=0.6, label=c("a","c","e") ), 0.6の値は、共分散の推定から来ているbmi1とbmi2(厳密のモノ接合子双子ペア)。2つの質問があります。 パスに0.6の「開始」値が与えられると彼らが言うとき、これはGLMの推定のように、初期値で数値積分ルーチンを設定するようなものですか? この値が一卵性双生児から厳密に推定されるのはなぜですか?

2
因果推論と予測の関係は何ですか?
因果推論と予測(分類と回帰の両方)の関係と違いは何ですか? 予測のコンテキストでは、予測子/入力変数と応答/出力変数があります。これは、入力変数と出力変数の間に因果関係があることを意味しますか?それで、予測は因果推論に属しますか? 私が正しく理解している場合、因果推論は、別の確率変数を与えられたある確率変数の条件付き分布を推定することを考慮し、確率変数間の条件付き独立性を表すためにグラフィカルモデルを使用することがよくあります。したがって、この意味での因果推論は予測ではありませんか?

2
効果修飾子と交絡因子の両方として機能する変数を持つことは可能ですか?
特定のリスクと結果の関連のペアに対して、効果(測定)修飾子と交絡因子の両方として機能する変数を持つことは可能ですか? 私はまだ区別が少しわかりません。私は違いを理解するのを助けるためにグラフィカルな表記法を見てきましたが、表記法の違いは当惑しています。両者のグラフィック/視覚的な説明と、それらが重複する可能性がある場合は、役立つでしょう。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.