タグ付けされた質問 「regression」

5
「制御変数」も内生的な場合はどうなりますか?
私は政治経済学で働いており、多くのモデルには人口、不平等、植民地時代の遺産などの「無実の」制御変数が含まれているため、著者は関心のある独立変数に偏りがないと主張できます。 しかし、これらの制御変数のいずれかがいくつかの省略された変数に内在している場合、これはすべての独立変数の不偏性を汚染しませんか? それが本当なら、私たちは何ができますか?これらの制御変数を除外すると、変数バイアス自体が省略されます。それらを含めると、モデル内のすべてを汚染します。 例:研究者は暴力に不等式リードを知りたい、と彼はいくつかのコントロール: いることを見て不平等はおそらく内因性であることを(あります省略された変数の利他主義のレベルのため)、彼はInequalityの道具変数を見つけようとします。しかし、成長と発達も内生的(つまり、利他主義のレベルと相関している)ではないでしょうか?Violence=Inequality+Growth+Development+ϵViolence=Inequality+Growth+Development+ϵ\begin{equation} Violence = Inequality + Growth + Development + \epsilon \end{equation} この例は馬鹿げているように見えるかもしれませんが、私の論点は政治経済/開発作業にあり、LHSに含まれる多くの変数が内生的であると思うので、非常に多くの要因があります(まだ省略されています)。しかし、多くの場合、研究者は自分のペットの独立変数のみの楽器を探します。

2
全人口に対する回帰
母集団全体が含まれる場合、回帰における係数の標準誤差の意味は何ですか? 私はこの質問にとても戸惑いました。私には思えるので、母集団全体が含まれている場合、標準誤差は意味がありません。母集団全体がすでにあるため、統計的推論は必要ありません。 しかし、トップジャーナルに掲載された多くの記事でさえ広く使用されています。たとえば、国のGDP成長率とその人口密度の関係を調べている場合、次の回帰を実行します。 GDPi=α+βPopi+γXi+ϵiGDPi=α+βPopi+γXi+ϵi GDP_i = \alpha + \beta Pop_i + \gamma \mathbf{X}_i + \epsilon_i 地球上の195か国すべてで。この場合、すべての国(人口)が含まれます。しかし、すべての文献は依然として係数の統計的有意性について述べています。 人口全体に回帰するとき、それは統計的推論の誤用であると誰かが説明できますか?

1
OLS係数を導出する別の方法
では私の別の質問、回答はOLS係数の以下の導出を使用しました: 我々は、モデルを有する:Zは未観測です。次に、plimY= X1β+ X2β2+ Zγ+ ε 、Y=X1β+X2β2+Zγ+ε, Y = X_1 \beta + X_2 \beta_2 + Z \gamma + \varepsilon, ZZZX * 1 =M2X1及びM2=[I-X2(X ' 2 X2)-1X ' 2 ]。プリムβ^1= β1+ γCo v (X∗1、Z)Va r (X∗1)= β1、plimβ^1=β1+γCov(X1∗,Z)Var(X1∗)=β1,\text{plim}\, \hat \beta_{1} = \beta_1 + \gamma \frac{Cov(X_1^*, Z)}{Var(X_1^*)} = \beta_1, バツ∗1= M2バツ1X1∗=M2X1X_1^* = M_2 …

1
相互作用効果のための制御
で 最近の論文 、Edelman et al。 AirBnBの差別がホストの特性によってどのように異なるかを(とりわけ)調べます。第一に、彼らは実地実験を行います。その中には、アフリカ系アメリカ人の名前に関連するものと、そうでないものがあります。それから、彼らは申込者がゲストレース、主催者の特徴および相互作用で受け入れられているかどうかを退行する。たとえば、彼らは、ゲストレース、ホストレース、およびその2つの相互作用の受け入れを後退させます。アフリカ系アメリカ人のホストが(例えば)差別する可能性が低い場合、アフリカ系アメリカ人からアプリケーションを受け取ることの効果はホストがアフリカ系アメリカ人。 ここまでは順調ですね。ただし、ホストの特性がランダムに割り当てられていないことを考えると、それらを制御する必要があります。さもなければ、本当の説明は彼らが高価な資産を提供する傾向があり、高価な資産を提供する人々は差別される可能性が低いということであるにもかかわらず、アフリカ系アメリカ人は差別される可能性が低いことがわかります。彼らはこれを知っているように見えます、なぜなら彼らはコントロールとして様々なホストと場所の特性を投入するからです。しかし、それを使用する方が良かったではないでしょうか 相互作用 コントロールとして申請者の民族性を持つこれらの共変量の?結局のところ、私たちは特定の特性を持つ人々がアフリカ系アメリカ人の応募者に対して異なる反応をするかもしれないという事実をコントロールしたいのです。

1
回帰で空のセルを除外するとどうなりますか?
回帰にStata 14.1を使用していますが、 matsize too small エラー。それは私にこの問題の考えられる理由を伝えるためにもう少しの出力を与えました、そして私はこれが私に適用された理由だと思います If you are using factor variables and included an interaction that has lots of missing cells, either increase matsize or set emptycells drop to reduce the required matrix size; see help set emptycells. はい、私は因子変数(米国とワシントンDCの各州に1つずつ)を使用しています。はい、空のセルがたくさんあります。 どのオプションが良いのか、空のセルを削除するか、行列のサイズを大きくしてすべての因子変数を含めることができるようにします。 空のセルを削除する、またはマットサイズを増やすという、両方のことを行う方法についての記事があります。私が理解しようとしているのは、「方法」ではなく「理由」です。空のセルをドロップすると、数学的にどうなりますか? (私はおそらく数学を理解できないでしょう。空のセルを省くのが良いのか悪いのかについての単純な答えがあれば、それはおそらくもっと良いでしょう。)

1
個人所得のモデル化に推奨される特定の分布はありますか?
私は統計学者であり、同僚は時々収入データを扱っていますが、通常は任意のカットオフを適用してロジスティック回帰を行います。 有効なサポート分布には無限の範囲があることは知っていますが、特に経済理論(またはおそらく経験的成功)によってサポートされている何かがあるかどうかを知りたいです。

1
重回帰。
重回帰グラフをプロットするにはどうすればよいですか?それは多次元の平面(説明変数の数に等しい)でしょうか?または、各ベータの線になります。傾斜またはベータは、特定のx(説明)に関してy(説明)の偏微分であるためですか??
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.