統計的に有意ではないにもかかわらず、回帰に変数を含める必要があるのはいつですか?


37

私は計量経済学とRの経験を持つ経済学の学生です。統計的に有意ではないにもかかわらず、回帰に変数を含めるべき状況があるかどうか知りたいですか?


1
医学研究では、定性的な相互作用が含まれる場合はそれを含めます。以前にここで参照したLacey Gunterの作品をご覧ください。また、2013年にSpringerから出版されたChakrabortyとMoodieの本。タイトルは、動的治療レジメンの統計的手法:強化学習、因果推論、および個別化医療です。
マイケルR.チャーニック

11
統計的有意性は完全にarbitrary意的であることも考慮してください。重要なことは何ですか?0.05?0.1?0.001?予測子を含める理論的基礎が存在する場合、それを維持するのに十分な理由です。
アッシュ

2
「統計的に有意ではない」と言うと、信頼度が5%であることに気づきますが、これは任意の選択です。(そして、より多くの変数があると、複数のテストの問題が発生します)。
-smci

1
@smci 0.05 = 5%の有意水準は95%の信頼水準に対応します。これは、同じ文に用語が混在しないようにするのに十分な理由です。信頼区間のない重要な手順があるため、通常は、より適切な用語を使用するのが最も簡単です。例外は、入門レベルでリンクを説明している場合です。
ニックコックス

回答:


30

はい!

係数がゼロと統計的に区別できないことは、係数が実際にゼロであること、係数が無関係であることを意味するものではありませ。効果が統計的有意性の任意のカットオフを通過しないということは、その効果を制御しようとしてはならないという意味ではありません。

一般的に言って、目前の問題とあなたの研究デザインは、リグレッサーとして何を含めるかをガイドするはずです。

いくつかの簡単な例:

そして、これを完全なリストとして受け取らないでください。さらに多くのことを考え出すのは難しくありません...

1.固定効果

これが頻繁に発生する状況は、固定効果による回帰です。

パネルデータがあり、モデルのを推定するとします。b

yit=bxit+ui+ϵit

が固定効果として扱われる通常の最小二乗でこのモデルを推定することは、各個人インジケータ変数で通常の最小二乗を実行することと同等です。 Iuii

とにかく、ポイントは変数(つまり、インジケーター変数の係数)がしばしば不十分に推定されるということです。個々の固定効果は、統計的に重要ではありん。ただし、固定効果を考慮している場合は、すべてのインジケーター変数を回帰に含めます。、U Iuiui

(さらに、ほとんどのstatsパッケージは、組み込みメソッドを使用する場合、個々の固定効果の標準エラーさえも与えないことに注意してください。個々の固定効果の重要性についてはあまり気にしません。 )

2.連携する機能...

(a)多項式曲線近似(コメントのハットチップ@NickCox)

次の多項式を何らかの曲線に当てはめている場合、ほとんどの場合、低次の多項式の項が含まれます。k

たとえば、2次多項式をフィッティングする場合は、次を実行します。

yi=b0+b1xi+b2xi2+ϵi

通常、を強制し、代わりに実行 するのは非常に奇妙ですy i = b 0 + b 2 x 2 i + ϵ ib1=0

yi=b0+b2xi2+ϵi

しかし、ニュートン力学の学生は例外を想像することができます。

(b)AR(p)モデル:

低次項も含めるAR(p)モデルを推定するとします。たとえば、AR(2)の場合:

yt=b0+b1yt1+b2yt2+ϵt

そして、実行するのは奇妙です:

yt=b0+b2yt2+ϵt

(c)三角関数

@NickCoxが言及しているように、と用語は同様に一緒になる傾向があります。詳細については、たとえばこのペーパーを参照してください。cossin

より広く...

適切な理論的理由がある場合は、右側の変数を含める必要があります。

また、ここおよびStackExchange全体での他の回答が説明しているように、段階的な変数選択は多数の統計上の問題を引き起こす可能性があります。

以下を区別することも重要です。

  • 小さい標準誤差で統計的にゼロと区別できない係数。
  • 統計的にゼロと区別がつかない係数で、大きな標準誤差があります。

後者の場合、係数が重要ではないと主張するのは問題です。単純に測定が不十分な場合があります。


最初の例に触れて、をモデルに保持する理由は、の解釈ががモデルにあるかどうかに関係なく変わるためです。(たとえば、en.wikipedia.org / wiki / Partial_regression_plotを参照してください。「の線形効果を制御する」というフレーズのようなものを使用します)。この状況では、その重要性のためにモデルにがなく、それが与える解釈のためにあります。 bでのuをI 、U I 、U Iuibuiuiui
user795305

5
いくつかの非常に良い答えがありますが、それでもすでに少し重なっているので、ここでコメントに私の例を限定します。多項式フィッティング:最も一般的には、二次方程式はほとんどの場合、線形項と二乗項の二重作用によってフィッティングされます。従来のレベルでは重要な用語が1つだけであっても、それらの共同効果が重要です。三角関数の予測因子同様に、サインとコサインは、通常のレベルで適格でなかった場合でも、通常一緒に属します。ダブルアクトはそのように取り付けられるべきです。
ニックコックス

2
@NickCoxこれはコミュニティwikiであり、あなたの主張はここで取り上げたものに直接関連しているので、あなたのコメントは適切な分岐点で回答に編集される価値があると思います。私はあなたにそれが自立答えとして最善ではないだろうとしている権利だと思うけれども私の意見では、単なるコメントのままに、あまりにも重要である
紙魚

@Silverfish Matthewはそれをコピーすることを歓迎します。しかし、私がそれを編集するのは少し厄介なようです。
ニックコックス

1
@NickCoxハハ、私は気にしません。:)私はあなたの提案を追加し、自由に編集してください!
マシューガン

14

はい、あります。統計的に意味のないレベルであっても、意味のある方法で応答変数と相関する可能性のある変数は、含まれていない場合、回帰を混乱させる可能性があります。これは仕様の不足として知られており、そうでない場合ほど正確ではないパラメーター推定につながります。

https://onlinecourses.science.psu.edu/stat501/node/328

上記から:

回帰式に1つ以上の重要な予測変数が欠落している場合、回帰モデルは指定不足です(結果2)。この状況はおそらく最悪のシナリオです。なぜなら、指定不足のモデルでは、バイアスされた回帰係数とレスポンスのバイアスされた予測が得られるからです。つまり、モデルを使用する際に、母集団の勾配と母平均を常に過小評価または過大評価します。すでに悪い問題をさらに悪化させるために、平均二乗誤差MSEはσ²を過大評価する傾向があり、それによって必要以上に信頼区間が広くなります。


4
それはまったく真実ではありません。交絡変数であるためには、対象の説明変数説明変数を発生させる必要があります。関心のある説明変数が変数を引き起こし、それが結果に影響を与える場合、それは介在変数であり、それを制御するべきではありません(全体の効果を分解したくない限り)。
マールテンビュイス

1
これは、交絡の制御に関する非常に不適切な議論です。結果との相関は交絡に十分な条件ではなく、メディエーターを制御することで因果モデルの誤指定につながる可能性があります:これは、「冠動脈動脈カルシウム(CAC)を制御した後、禁煙は心血管疾患のリスクを低下させない」などの誤toを導きます。CACは、喫煙が心臓病をもたらす主な方法です。パールによる因果関係、第2版、第3章セクション3を参照してください
。– AdamO

編集してください。彼が答えの中でそのような深さを探しているとは思わなかった。
ダブルトラブル

11

通常、線形回帰の変数は重要であるため、含めたり除外したりしません。選択した変数が回帰基準の(良い)予測子であると仮定するため、それらを含めます。つまり、予測子の選択は理論に基づいています。

線形回帰の統計的有意性は、次の2つのことを意味します(そのことは知っています)。

  1. 重要でない予測子は、基準に関連していません。それらを除外しますが、重要でないことは、それらが無関係であることを証明しないことに注意してください。あなたの理論を確認してください。
  2. 予測変数は、他の予測変数の関数として表現できるため、重要ではありません。予測子のセットは、マルチコリニアと呼ばれます。これは、予測子をいかなる意味でも「悪い」ものにするのではなく、冗長なものにします。

重要でない予測子を除外する正当な理由は、基準の分散またはその大部分を説明する予測子の最小サブセットを探していることです。見つかった場合は、理論を確認してください。


[P]回帰基準の指標?これを言い換えることをお勧めします。
リチャードハーディ

8

計量経済学では、これは左右に起こります。たとえば、四半期ごとの季節性ダミーQ2、Q3、およびQ4を使用している場合、グループとして重要であることがよくありますが、それらのいくつかは個別に重要ではありません。この場合、通常はすべてを保持します。

別の典型的なケースは相互作用です。モデル考えます。主効果は重要ではありませんが、相互作用は重要です。この場合、主効果を維持するのが習慣です。あなたがそれを落とすべきではない理由はたくさんあり、それらのいくつかはフォーラムで議論されました。zのX * Zyxzzxz

更新:別の一般的な例は予測です。計量経済学は通常、経済学部門の推論の観点から教えられます。推論の観点では、何が何を引き起こすのかを理解しようとしているため、p値と有意性に多くの注意が向けられています。予測では、モデルが関心のある変数をどれだけうまく予測できるかが重要であるため、このようなことにはあまり重点が置かれていません。

これは、最近経済学に進出している機械学習アプリケーション(btw)に似ています。よく予測できないすべての重要な変数を含むモデルを作成できます。MLでは、いわゆる「オーバーフィッティング」に関連付けられることがよくあります。明らかに、予測ではそのようなモデルの使用はほとんどありません。


1
これはいくつかの点で少し誇張されているようです。たとえば、教科書だけでは経済学者ではない私としても、少なくとも数十年にわたって予測が経済学者に広く教えられてきたことは明らかです。「最近の」(正確にはどういう意味ですか)の増加があったかどうかは、インサイダーに任せるより微妙な点です。
ニックコックス

@NickCoxは、カリキュラムにまったく予測がなかったかのように聞こえましたが、そうではありませんでした。
アクサカル

7

次の2つの質問をしています:

  1. 統計的有意性はいつ重要ではありませんか?
  2. 統計的に有意ではないにもかかわらず、回帰に変数を含める必要があるのはいつですか?

編集:これは元の投稿には当てはまりましたが、編集後は当てはまらない可能性があります。


第1四半期については、広すぎるという境界にあると思います。多くの可能な答えがあり、いくつかはすでに提供されています。もう1つの例は、予測用のモデルを構築する場合です(説明については、下記のソースを参照してください)。


Q2に関して、統計的有意性はモデル構築の健全な基準ではありません。Rob J. Hyndmanは、ブログ投稿「変数選択の統計テスト」で次のように書いています。

統計的有意性は、変数をモデルに含める必要があるかどうかを判断するための通常の基礎ではありません。<...>統計的検定は、変数を選択するのではなく、仮説を検定するために設計されました。

また、偶然だけで統計的に有意な変数を見つけることがあることに注意してください(確率は、選択した有意水準によって制御されます)。変数が統計的に有意であるという観察は、変数がモデルに属していると結論付けるのに十分ではありません。


4

別の「はい」を追加します。私はいつも共変量の選択における第一の考慮事項が統計ではなく領域の知識であることを教えてきました-そしてそれを伝えようとしました-。私は個人にいくつかの健康上の成果をモデル化していた場合に生物統計学では、例えば、その後、関係なく、どのような回帰が言うには、モデルの年齢、人種、性別を含めない私のためにいくつかのくそ良いの引数を必要としないでしょう。

また、モデルの目的にも依存します。目的が結果に最も関連している要因をよりよく理解することである場合、par約的なモデルの構築にはいくつかの長所があります。予測を重視し、理解を重視するのでなければ、共変量を排除することはささいな懸念かもしれません。

(最後に、変数の選択に統計を使用する場合は、フランク・ハレルがこのテーマについて何を言っているかを確認してください-http ://www.stata.com/support/faqs/statistics/stepwise-regression-problems/、そして彼の著書回帰モデル戦略簡単に言えば、あなたが使用段階的または最良の予測因子を選択するための同様の統計に基づいた戦略をした時には、「これらの良好な予測因子である?」のいずれかのテストがひどく偏っていることで- 。のコース彼ら」良い予測子であるため、それらに基づいてそれらを選択したため、これらの予測子のp値は誤って低くなります。)


1
@EconJohnそして、モデルF統計、、および効果推定値が誤って高い...およびステップワイズで選択されたモデルは、真の予測子と偽の予測子を等しく保持する可能性が高く、真の予測子と偽の予測子を削除する可能性がほぼ同じです。R2
アレクシス

4

「統計的有意性」の結果が本当に言う唯一のことは、タイプIエラーの選択されたレベルでは、従属変数に対するリグレッサーの効果が正か負かを判断することすらできないことです(この投稿を参照)。

したがって、このリグレッサーを保持する場合、従属変数に対するそれ自体の影響に関する議論には、それをバックアップする統計的証拠はありません。

しかし、この推定の失敗は、リグレッサが構造関係に属していないことを示しているのではなく、特定のデータセットでは係数の符号を確実に決定することができなかったことを示しているだけです。

したがって、原則として、その存在をサポートする理論的議論がある場合、リグレッサーを保持する必要があります。

ここでの他の回答は、そのようなリグレッサが仕様に保持されている特定のモデル/状況を提供しました。たとえば、固定効果パネルデータモデルに関する回答です。


なぜ「信頼レベル」を重要性の議論にドラッグするのですか?「99%の信頼レベルで重要」など、質の悪いテキストや論文で怪物を頻繁に読みます。アイデアの間には確かに関係がありますが、この言葉遣いは必要ありません(初級レベルでは説明するほど混乱します)。
ニックコックス

@Nick Coxポイントがあります。「タイプIエラー」に変更しました。
アレコスパパドプロス

1

統計的に有意ではない場合でも、研究の焦点である場合は、特に関心のある変数を含めることができます。また、生物統計学では、臨床的意義はしばしば統計的意義とは異なります。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.