ロジスティック回帰とマンホイットニー/ t検定の選択


8

私は、先験的に決定された0と1の比率を持たない二分変数と、連続変数持っています。b

シナリオ1では、Iが指定する決めるとして独立変数、およびのように従属 変数。次に、マンホイットニー(分布なし)、t検定(正規分布)などの検定を使用して、をに対して検定します。バツbyバツy

シナリオ2では、私が指定することを決定したように従属変数、及びなどの独立 変数。次に、ロジスティック回帰を使用してをに対してテストします。Ybx YバツバツY

  1. と関係の方向性がわからない場合、つまりが独立変数であるかが独立変数であるかを判断できない場合、どのモデルを選択する必要がありますか?b A bbb

  2. 従属変数と独立変数のどちらがわからない場合、最初のインスタンスでt検定/マンホイットニーを一種の単変量分析として使用し、ロジスティック回帰を多変量分析として使用することは無効ですか?

回答:


6

質問1の答えは、あなたの研究の質問と、その結果を誰が聴くかによって異なります。

調査の質問が、Aのプロファイルに基づくbの違いについて話していることを示している場合、それは明らかに要約を組み立てるのに役立ちます。疫学調査では、A(露出/非露出状態としての独立変数)に基づいてサンプリングしていなくても、この分類を独立変数[露出]として使用し、連続変数を従属変数[結果]として使用することは理にかなっています]。あなたはすでにこれに対する答えを知っているようです。

また、結果を他の人に提示する(そして自分で解釈する)観点から、結果をどのように解釈するかについても検討する必要があります。従属変数としての連続変数[結果]モデルは、1つの要約として平均差(または類似)を持ちます。結果の二分変数は、オッズ比を持ちます(連続変数の1ユニットあたりのオッズの増加の比率。これは、たとえば、II型糖尿病の可能性について、追加の体重5キロあたりの相対的な増加を与えるようにスケーリングできます。)

設定をコンサルティングしてこれを人々に説明した経験は、前者(平均の違い)は一般に後者(他の連続した独立変数の1単位の違いあたりのオッズ比)よりも簡単に説明できるということです。

あなたのために質問2あなたは共変量について調整している多変量モデルを、実行したい場合は、それは開始時に依存/独立変数を選択するのに役立ちます。説明を簡単にするために、2つのアプローチ間で変更するのではなく、単変量から多変量分析まで同じ方法を使用するのがおそらく最善です。

この後者の点に関する最後の注記:仮説テストの観点から、連続する独立変数[露出]と[単一]の二項従属変数によるロジスティック回帰は、変数との不平等分散を仮定する不対t検定と同じp値を返す必要があります逆転(メモリから-ただし、これが常に正しいかどうかは完全にはわかりません。)


2
この質問に答える(stats.stackexchange.com/questions/48381/…)バイナリロジスティック回帰と対になっていないt検定ncbi.nlm.nih.gov/pubmed/9699234の
James Stanley

6

Wilcoxon-Mann-Whitney検定は、比例オッズの順序ロジスティックモデルの特殊なケースであるため、ロジスティック回帰を使用するためにモデルを変える必要はないと言えます。しかし、モデルを選択する際の基本的な問題は、どの変数を調整するのが理にかなっているのかを判断することです。


2
@Frankは非常に興味深く鋭い概念ですが、詳細はありません。私に詳しく説明してください:二分変数の量的変数の順序ロジスティック回帰がマンホイットニー検定とまったく同じである場合のこの「特別なケース」は何ですか?
ttnphns 2012年

1
kグループを表す、予測子として一連のダミー変数のみを持つ比例オッズモデルは、kグループ(k = 2-> Wilcoxon)のクラスカル-ワリスランク分散分析と同等です。スコア統計の分子は、ランクANOVA統計(Wilcoxon)です。
フランクハレル2012年

1
@フランク、あなたの答えでいくつかの小さなデータの同等性を実証する(証明する)時間を見つけることができますか?それは面白くて重要です。リファレンスがあれば、それもいいかもしれません。どうもありがとう。
ttnphns 2012年

1
ジョン、ホワイトヘッド:順序付けられたカテゴリデータのサンプルサイズの計算を参照してください。医学統計 12:2257-2271; 1993。バイナリケースについては、編集者SM 15:1065-6への手紙を参照してください。SM13:871 1994の正誤表を参照してください
フランクハレル

2
答えの最後の文を詳しく教えていただけますか?ありがとう。
jetistat001 2012年

1

それは部分的な答えの試みです:

YバツY=1Y=0

一方、Mann Whitneyはこれに問題がないようです。つまり、ケースコントロール研究であるかどうかを保持しています。


1
YY

まあ、ロジスティック回帰はケースコントロール研究で動作するように特別に設計されましたstats.stackexchange.com/questions/67903/…を
kjetil b halvorsen

0

多くの質問と同様に、答えは分析を実行する際の根本的な目的に依存します。二分変数Aと連続変数bの間に有意な関連があることを示すだけでなく、変数Aに記録されたイベントの予想される可能性を計算できることに関心がある場合は、ロジスティックを使用します。このアプローチは回帰方程式を提供するため、回帰。さらに、Aとbの2変量の場合のロジスティック回帰は、共変量の制御、仲介モデルのテスト、相互作用の検証、およびすべての重回帰で実行できる他の良いこと。そうは言っても、多分変数Aと連続変数Bを関連付けるリンク関数を考慮する必要があります。ロジスティック回帰はロジットリンクを使用しました。結果の確率が非常に高いまたは低い場合はより適切ですが、プロビットリンクはより適切な場合があります。イベントの確率は0.5に近くなります。データに適したリンク関数を選択することは、優れた回帰モデルを構築するために重要です。リンク機能の詳細については、次のリンクを参照してください。5データに適したリンク関数を選択することは、優れた回帰モデルを構築するために重要です。リンク機能の詳細については、次のリンクを参照してください。5データに適したリンク関数を選択することは、優れた回帰モデルを構築するために重要です。リンク機能の詳細については、次のリンクを参照してください。

http://www.stat.ufl.edu/CourseINFO/STA6167/logistregSFLM.pdf

http://www.norusis.com/pdf/ASPC_v13.pdf


2
確率が.5に近いかどうかに関係なく、ロジットとプロビットリンクのどちらを使用するかを選択する必要はないと思います。私はここでリンクの選択について書いています:差分ビジット間とプロビットモデルcloglog応答カテゴリーが不均衡な時期を人々が示唆するのを聞いたことがありますが、他のオプションが存在します。
ガン-モニカの復活
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.