少しググったけど、何も見つからなかった。
従属変数のq番目の分位点で分位点回帰を行うとします。
次に、DVをq番目の分位点で分割し、結果に0と1のラベルを付けます。次に、分類されたDVに対してロジスティック回帰を行います。
私はこれのモンテカルロ研究または他のものより好む理由を探しています。
少しググったけど、何も見つからなかった。
従属変数のq番目の分位点で分位点回帰を行うとします。
次に、DVをq番目の分位点で分割し、結果に0と1のラベルを付けます。次に、分類されたDVに対してロジスティック回帰を行います。
私はこれのモンテカルロ研究または他のものより好む理由を探しています。
回答:
簡単にするために、連続従属変数Yと連続予測子変数Xがあるとします。
ロジスティック回帰
私があなたの投稿を正しく理解している場合、ロジスティック回帰は、Yの(無条件)分布の分位に基づいてYを0と1に分類します。具体的には、観測されたY値の分布のq番目の分位が計算され、YcatはYがこの分位点よりも厳密に小さい場合は0、Yがこの分位点以上の場合は1として定義されます。
上記があなたの意図を捉えている場合、ロジスティック回帰は、Xの関数として(無条件)Y分布の(観測された)q番目の分位を超えるまたは等しいYのオッズをモデル化します。
四分位回帰
一方、XでYの分位数回帰を実行している場合は、Xの関数としてYの条件付き分布のq番目の分位がどのように変化するかをモデル化することに焦点を当てています。
ロジスティック回帰と四分位回帰
最初の手順(つまり、ロジスティック回帰)はYの無条件分布のq番目の分位に焦点を当てているので、これら2つの手順(つまり、分位回帰)は、 Yの条件付き分布のq番目の分位数。
The unconditional distribution of Y is the
distribution of Y values (hence it ignores any
information about the X values).
The conditional distribution of Y given X is the
distribution of those Y values for which the values
of X are the same.
実例
説明のために、Y =コレステロール、X =体重としましょう。
次に、ロジスティック回帰は、「高」コレステロール値(つまり、観測されたコレステロール値のq番目の分位以上)のオッズを体重の関数としてモデル化します。「高」の定義には、体重との関係。言い換えれば、「高い」コレステロール値を構成するもののマーカーは、体重とは無関係です。このモデルで体重によって変化するのは、コレステロール値がこのマーカーを超える確率です。
一方、分位数回帰では、基礎となる集団で同じ体重の被験者のq%がコレステロール値が高い「マーカー」コレステロール値が、体重の関数としてどのように変化するかを調べています。これらのコレステロール値は、どのコレステロール値が「高い」かを識別するためのマーカーと考えることができますが、この場合、各マーカーは対応する体重に依存します。さらに、マーカーは、Xの値が変化すると予測可能な方法で変化すると想定されます(たとえば、マーカーはXが増加するにつれて増加する傾向があります)。
私がこれらを正しく書き起こした場合、これは大体の取り決めです。については、https://en.wikipedia.org/wiki/Quantile_regressionを参照してください。
ロジスティック回帰:
四分位回帰
質問です(覚えていません)これらの変分問題のスコア関数はMLEで可能な唯一の問題ですか?そうでない場合、同じペアリングが生成されるという意味で同等性を保証するペアリングはありますか?