(ロジスティック)回帰に「予測」という単語を使用するのはどの程度公平ですか?


9

私の理解は、回帰でさえ因果関係を与えないということです。これは、y変数とx変数の間の関連付けと、場合によっては方向のみを与えることができます。私は正しいですか?ほとんどのコースの教科書やオンラインのさまざまなコースページでも、「xはyを予測する」に似たフレーズをよく見かけます。また、リグレッサを予測子、yを応答と呼ぶことがよくあります。

  1. 線形回帰にそれを使用することはどれほど公平ですか?
  2. ロジスティック回帰はどうですか?(確率tを比較できるしきい値tがある場合)

1
エラー部分を予測する方法がなく、完全にランダムであることがわかっている限り、使用しても問題ありません。
Aksakal

1
ランダムまたはその他のエラー部分はありません。
フランクハレル2015年

回答:


21

「予測」という言葉を使っても問題ありません。

予測は因果関係とは無関係であることを認識することが重要です。病院の緊急治療室で亡くなったほとんどの人が心臓発作で死亡した場合を考えてみてください。患者が死亡したと聞いても原因がわからない場合は、心臓発作が50%以上の原因であることがわかっているため、心臓発作が原因であると予測できます。あなたは予測を行っていますが、既知の影響から未知の原因を予測しています。また、この例の予測はカテゴリカルであるため、ロジスティック回帰に類似しています。(アナロジーは多項ロジスティック回帰よりも強力ですが、ここでは関係ありません。)

価値があるのは、予測が直接の因果関係にまったく関連している必要がないことです。関係が信頼できる限り、偽の相関に基づいて予測を行うことができます。双子の兄弟に基づいて、同一の双子の未知の高さを予測することを検討してください。この場合、両方の高さは一連の一般的な原因(遺伝学と環境の共有)の影響です。どちらの双子の高さも、もう一方の原因または結果ではありません。それにもかかわらず、この状況では非常に優れた予測を行うことができます。


「疑似回帰」の例+1!
PatrickT 2015年
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.