ステップワイズ回帰を使用したことによるハウラー


20

私は回帰モデルにおける段階的/前方/後方選択の問題をよく知っています。研究者が方法を非難し、より良い代替案を指摘している多くの事例があります。統計分析が存在するストーリーが存在する場合、私は興味がありました:

  • 段階的回帰を使用しました。
  • 最終モデルに基づいていくつかの重要な結論を出しました
  • 結論が間違っていて、個人、研究、または組織にマイナスの結果をもたらした

段階的な方法が悪い場合、これについての私の考えは、それらを使用するための「現実の世界」に結果があるはずです。


2
そのようなストーリーが見つからない場合は、基本的な研究でステップワイズ回帰が主に使用されているためである可能性があります(または私はそう感じています)。基本的な研究者は、データなどを偽造しない限り、通常、間違っていることで問題になりません。
-Kodiologist

3
業界や教室で多く使用されています。研究では、著者はおそらく彼らがそれを使用したことを開示しないでしょう。業界では、主な2つの理由は、a)それをしている人が研究の訓練を受けていない、例えば学士号を取得している、またはb)数十年前に卒業したことです。
アクサカル

@Aksakalそもそも学習するのではなく、とにかく羊の皮を手に入れることが問題であり、経過時間ではありません。Exemplis gratis、私。私は2006年頃に出版物に使用される統計を1971年頃の1つの統計もちろん取って、最初の
カール・

回答:


1

質問が複数あります。最も狭いものは、段階的な回帰が段階的に実行されたために、いつ段階的な回帰が害を引き起こしたかの例を求めています。もちろんこれは真実ですが、段階的回帰に使用されるデータも公開され、誰かがそれを再分析し、公開された主要著者の撤回とともに査読済みの修正を公開する場合にのみ明確に確立できます。他の状況で告発することは法的措置をとるリスクがあり、別のデータセットを使用する場合、間違いがあったと疑うことができますが、「統計は何も証明しない」ため、間違いがあったことを確認することはできません製; 「合理的な疑いを超えて」。

実際のところ、回帰式の段階的除去または段階的構築のどちらを行うかによって、しばしば異なる結果が得られます。これは、どちらのアプローチもその使用を推奨するのに十分に正しいことを示唆します。明らかに、他に何かが起こっており、それは上記で尋ねられたより広範な質問に至りますが、箇条書きでは、「段階的回帰の問題は何ですか?それは答えるのにより有用な質問であり、それに答えるために私に対して訴訟を起こさないという追加の利点。

ステップワイズMLRに対して適切に行うには、1)物理的に正しい単位(以下を参照)、および 2)最適な相関とエラー分布タイプ(等分散性と物理性)に適した変数変換、および 3)変数の組み合わせのすべての順列を使用し、段階的に、それらのすべて及びその後4)のいずれかを実行徹底的な回帰診断なら高いVIFを逃すことを回避する1(共線)そうでなければ誤解を招くことになる変数の組み合わせは、次いで、報酬が良い回帰です。

上記の#1で約束したように、次に物理システムの正しいユニットを調べます。回帰からの良い結果は変数の正しい取り扱いに依存するため、物理単位の通常の次元に留意し、方程式を適切にバランスさせる必要があります。また、生物学的用途の場合、アロメトリックスケーリングの次元に関する認識と説明が必要です。

ユニットのバランスを生物学に拡張する方法については、生物学的システムの物理的調査のこの例をお読みください。その論文では、上記のステップ1)から4)が続き、広範な回帰分析、すなわちを使用して最良の式が見つかりました。ここで、は糸球体濾過率です。 、異化のマーカーは重量が4次元のフラクタル幾何構造であり、Vは体積がユークリッドまたは3次元変数と呼ばれるように、単位はフラクタル幾何を使用して理解されます。次に、 G F R W 1 = 1GFR=kW1/4V2/3GFRW GFR1=1443+23。そのため、式は代謝と次元的に一貫しています。それは理解しやすい文ではありません。1)が代謝のマーカーであることは一般に認識されていません(不明)。2)フラクタル幾何学はめったに教えられず、提示された式の物理的解釈は、数学的訓練を受けた人でも把握するのが困難です。GFR


2
これは、特に段階的な回帰ではなく、回帰一般の問題を説明しているようです。
偶発的な統計家

2
はい、これらは一般的に考慮すべき回帰の側面です。質問がどこから来たのかを正しく理解していれば、それはLASSOのようなものを使用することを支持してしばしば非難される段階的な回帰によって動機付けられます。
偶発的な統計学者

4
この件に関する率直さと善意に感謝します、カール。投票に問題があることを否定しません。投稿の投票を変更する唯一の効果的な方法は、答えを変更することです-技術的に改善する、拡張する、またはアイデアを異なる方法で伝えることのいずれかです-そして、それでも望ましい応答が得られる保証はありません(または、まったく応答しません!)。時々、ダウンボッターを理解するために作られた敬意を払った努力は、誰もが投稿を改善するそのような努力を高く評価する(そして賛成する)のに役立つ情報を引き出します。
whuber

3
@Carl私は、あなたが定期的に下票を獲得している場合、最初にするべきことは、あなたが投稿を改善する方法を検討することだと思います(そしてしばしばあなたはそれらの下に改善を示唆するコメントがあります)。自分の意見では、私がコメント者に同意しない場合でも、彼らはとにかくより良い答えにつながる問題を提起することが多いことがわかります。私はあなたの答えの問題に定期的に気づき、それは私自身がそれを下票するように私を動かすでしょう。時間があれば、コメントを残そうとします。
Glen_b -Reinstateモニカ

3
段階的回帰の問題の多くは、推定値が0から偏る、標準誤差が0に偏る、公称タイプIの誤り率が実際よりもはるかに低いなど、すべてのサブセットでさまざまな問題が依然として存在することに注意してください- -確かに、それはほとんどあらゆる形態の最適化の問題です(フランクハレルの回帰モデリング戦略の第4章は有用なリファレンスです)。収縮/正則化はこれらの問題のいくつかを緩和することができ(特に、選択が推定値を外側に偏らせる傾向)、サンプル外評価はそれらの多くにとって重要なツールです。
Glen_b -Reinstateモニカ
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.