分位点回帰は、分位点で変数が分割されたロジスティック回帰とどのように比較されますか?


9

少しググったけど、何も見つからなかった。

従属変数のq番目の分位点で分位点回帰を行うとします。

次に、DVをq番目の分位点で分割し、結果に0と1のラベルを付けます。次に、分類されたDVに対してロジスティック回帰を行います。

私はこれのモンテカルロ研究または他のものより好む理由を探しています。


2
2つの回帰の結果を比較するための合理的な方法を教えてください。結局のところ、少し一般的でないことを念頭に置いていない限り、これら2つのモデルのリグレッサの係数はまったく異なる意味と解釈を持っているので、どのような意味で「優先する」という意味を理解する必要がありますか?
whuber

上記の他のすべてのコメントに加えて、無条件分位回帰(Firpo et al 2009)は、説明したとおりに実際に回帰を使用して(分布のいくつかの無条件分位によって定義された従属変数)、その方法論を実装します。
Fcold

回答:


7

簡単にするために、連続従属変数Yと連続予測子変数Xがあるとします。

ロジスティック回帰

私があなたの投稿を正しく理解している場合、ロジスティック回帰は、Yの(無条件)分布の分位に基づいてYを0と1に分類します。具体的には、観測されたY値の分布のq番目の分位が計算され、YcatはYがこの分位点よりも厳密に小さい場合は0、Yがこの分位点以上の場合は1として定義されます。

上記があなたの意図を捉えている場合、ロジスティック回帰は、Xの関数として(無条件)Y分布の(観測された)q番目の分位を超えるまたは等しいYのオッズをモデル化します。

四分位回帰

一方、XでYの分位数回帰を実行している場合は、Xの関数としてYの条件付き分布のq番目の分位がどのように変化するかをモデル化することに焦点を当てています。

ロジスティック回帰と四分位回帰

最初の手順(つまり、ロジスティック回帰)はYの無条件分布のq番目の分位に焦点を当てているので、これら2つの手順(つまり、分位回帰)は、 Yの条件付き分布のq番目の分位数。

The unconditional distribution of Y is the 
distribution of Y values (hence it ignores any 
information about the X values). 

The conditional distribution of Y given X is the 
distribution of those Y values for which the values 
of X are the same.  

実例

説明のために、Y =コレステロール、X =体重としましょう。

次に、ロジスティック回帰は、「高」コレステロール値(つまり、観測されたコレステロール値のq番目の分位以上)のオッズを体重の関数としてモデル化します。「高」の定義には、体重との関係。言い換えれば、「高い」コレステロール値を構成するもののマーカーは、体重とは無関係です。このモデルで体重によって変化するのは、コレステロール値がこのマーカーを超える確率です。

一方、分位数回帰では、基礎となる集団で同じ体重の被験者のq%がコレステロール値高い「マーカー」コレステロール値が、体重の関数としてどのように変化するかを調べています。これらのコレステロール値は、どのコレステロール値が「高い」かを識別するためのマーカーと考えることができますが、この場合、各マーカーは対応する体重に依存します。さらに、マーカーは、Xの値が変化すると予測可能な方法で変化すると想定されます(たとえば、マーカーはXが増加するにつれて増加する傾向があります)。


2
私はそのすべてに同意します。しかし、類似点があるように見えます。つまり、どちらもqth分位点を同じ独立変数の関数と見なしています。
Peter Flom

4
はい。ただし、1つの方法は無条件分位(ロジスティック回帰)を参照し、もう1つは条件付き分位(分位回帰)を参照するという違いがあります。これらの2つの変位値は、異なるものを追跡します。
Isabella Ghement

3

それらは等しくありません、そしてその理由は簡単です。

分位点回帰では、独立変数の条件付き分位点をモデル化します。ロジスティック回帰を使用するアプローチは、限界分位に適合します。


1

「従属変数の分布のn番目の分位数への影響は何ですか?」もう1つは、「従属変数が無条件分布のn番目の分位に該当する確率にどのような影響があるか」と尋ねます。

つまり、両方に「分位数」という単語が含まれているという事実により、実際よりも似ているように見えます。

最初に条件付き分位関数を推定し、これを分割に使用し、そこから処理を進めると、2つのアプローチはより類似したものになると思います。しかし、私はあなたがそのような回り道から何を得ることができるかわかりません。。


0

私がこれらを正しく書き起こした場合、これは大体の取り決めです。については、https://en.wikipedia.org/wiki/Quantile_regressionを参照してくださいρp

ロジスティック回帰:

p(ythresh)=argminpiJlogistic(p,yi<ythresh)

四分位回帰

y(pthresh)=argminyiρp(yiy)

質問です(覚えていません)これらの変分問題のスコア関数はMLEで可能な唯一の問題ですか?そうでない場合、同じペアリングが生成されるという意味で同等性を保証するペアリングはありますか?(p,y)

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.