分位点回帰予測


13

一部のモデルで変位値回帰を使用することに興味がありますが、この方法論を使用して何を達成できるかについて明確にしたいと思います。特に外れ値や不均一分散に直面している場合、IV / DV 関係のより堅牢な分析が得られることは理解していますが、私の場合は予測に焦点を当てています。

特に、より複雑な非線形モデルや区分的線形回帰に頼らずに、モデルの適合性を改善することに興味があります。予測では、予測子の値に基づいて最高確率の結果分位を選択することは可能ですか?言い換えると、予測子の値に基づいて、各予測結果の分位確率を決定することは可能ですか?

回答:


8

分位点回帰のモデルの右側には、OLSなどの他の回帰モデルと同じ構造と仮定のタイプがあります。分位回帰との主な違いは、1つの直接の分布の分位数を予測することであるを条件Xをパラメトリック分布の操作(例えば、に頼ることなくˉ X ± 1.96 )、及び残差のない分布形状を仮定すると以外と仮定されていないことYをは連続変数です。YXx¯±1.96sY


1
フィッティングプロセスがどのように機能するか理解できたと思います。私が理解していないのは、観測値がどの分位になるか知らずに予測(分位数​​パラメーターの選択)を改善する方法があるかどうかです。これを何らかの方法で予測値から導出できますか?予測子と観測値の確率分布に基づいて使用できるものがあるかもしれません。
ロバートキューブリック

2
分位点回帰では、かなりの量のバックグラウンドを読む必要があると思います。観測値は「分位単位」ではありません。分位は、連続分布のプロパティです。0.5分位は中央値です。0.75分位は上位四分位です。の0.75分位数| X = xは、X = xのときのYの75パーセンタイルです。Y|バツ=バツYバツ=バツ
フランクハレル

2
フランク、分位点回帰についてもっと学ぶ必要があると確信しています。ダイブする前に、この方法論が、予測子と近似モデルに基づいて、変位値の選択に確率的要素を提供できるかどうかを理解したいと思います。予測値の特定のセット/範囲ごとに、実際の結果が特定の変位値領域に収まる可能性がなければなりません。
ロバートキューブリック

4

分位点回帰は、従属変数の分位点を予測することです。「通常の」回帰では、DVの平均を予測します。しかし、DVの他の部分に関心があるかもしれません。たとえば、どの新生児が非常に軽くなるか、どの曲が非常に人気があるか、またはどの顧客が大量のものを買うかを予測することに興味があるかもしれません。

私は昨年、NESUGについてそれについて論文を書きました。


2
知りたい情報に基づいて、予測する分位を選択します。どの質問をするべきかをプログラムが教えてくれません!
ピーターフロム-モニカの復職

1
当てはめられたモデルが与えられると、予測値に基づいて、予測値が0.6分位に入る確率を計算できませんか?
ロバートキューブリック

2
「.6変位値内」ではなく、0.6変位値以上ですが、はい。ただし、予測する変位値を決定する必要があります。OLS回帰では、条件付き平均を予測します。分位点回帰では、条件付き分位点を予測します
Peter Flom-Reinstate Monica

5
ピーターが示したように、あなたはまだ以前のコメントを理解していません。分位点回帰は、特定の分位点を上回ったり下回ったりする確率の計算とは関係ありません(0.6分位に「入」る確率は定義上ゼロです)。中央値またはその他の変位値を予測することに興味があるかどうかを確認してから、それを行います。条件付き分位は、範囲ではなく単一の数値です。
フランクハレル

1
私は理解していれば、uがウルの予測に使用する分位を選ぶが、そこに電子予測のための電子最善であるクォン選択する方法ではありません
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.