分位点回帰におけるR二乗


21

変位値回帰を使用して、データの90パーセンタイルの予測変数を見つけています。これをRでquantregパッケージを使用して行っています。予測変数によってどの程度の変動が説明されているかを示す変位値回帰のを決定するにはどうすればよいですか?r2

私が本当に知りたいこと:「どの程度の変動性が説明されているかを見つけるために使用できる方法は?」P値による有意水準は、コマンドの出力で使用可能です:summary(rq(formula,tau,data))。どうすればフィット感を得ることができますか?


7
R2は分位点回帰には関係ありません。
whuber

@whuber:どの程度の変動が説明されているかを見つけるために使用できる代替方法はありますか?
rnso 14

2
コメントに埋めるのではなく、質問の本文で尋ねるのは良いことです!「説明された変数」(とにかく、分散に関して測定される)は、本質的に最小二乗の概念です。おそらくあなたが望むのは、統計的有意性または適合度の適切な尺度です。
whuber

性能指数については、何が良いパフォーマンスになるのか、何がパフォーマンスが悪いのか、何が無関係なのかを考慮する必要があります。たとえば、90パーセンタイルが10パーセンタイルの粗末な予測因子である場合、それは90パーセンタイルに対する批判ではありません。クォンタイル回帰を使用していない場合、ベンチマークは使用するものであれば何でもかまいません。予測変数が連続している場合、それを定義するのは難しいかもしれません。
ニックコックス14

1
@whuber:それを質問の本文に追加しました。P値による有意水準は、summary(rq(formula、tau、data))出力で利用可能です。どうすればフィット感を得ることができますか?
rnso 14

回答:


23

KoenkerとMachadoは、特定の()分位点での適合度の局所的な尺度であるについて説明しています。 R 1 τ[1]R1τ

LETV(τ)=minbρτ(yixib)

ましょう及びフルモデルの係数の推定値、および制限モデルで、およびletと BE対応する用語。β^(τ)β~(τ)V^V~V

それらは、適合度基準を定義します。R1(τ)=1V^V~

Koenkerはここでコードを提供します、V

rho <- function(u,tau=.5)u*(tau - (u < 0))
V <- sum(rho(f$resid, f$tau))

我々計算あれば切片のみ内蔵モデル( -またはコードスニペットに以下)、次いで無制限モデル()、我々は計算することができる少なくとも概念的-だということを-通常の多少似ています。VV~V0V^R1 <- 1-Vhat/V0R2

編集:もちろん、f$tauコードの2行目の呼び出しのどこに配置される2番目の引数は、tau使用した値のいずれかになります。最初の行の値は、単にデフォルトを設定するだけです。

「平均に関する分散の説明」は、分位点回帰で行っていることではないため、実際に同等の測定値を期待するべきではありません。

概念が変位値回帰にうまく変換するとは思わない。ここに示すように、さまざまな多かれ少なかれ類似した量を定義できますが、何を選択しても、実際のがOLS回帰で持つプロパティのほとんどはありません。必要なプロパティと不要なプロパティについて明確にする必要があります-場合によっては、必要なことを実行するメジャーを持つことができる場合があります。R 2R2R2

-

[1] Koenker、R and Machado、J(1999)、
適合度および関連する推論プロセスの分位点回帰、
Journal of the American Statistical Association、94:448、1296-1310


tau = 0.9は0.5ではなく?
Dimitriy V. Masterov

はい、そうする必要がありますが、正しい2番目の引数を指定した場合(上記で引用した2行目で行われているように)、それがどのように機能するかです。tau関数を呼び出すときに指定しない場合、最初の行の値0.5は単にデフォルトの引数です。ポストで明確にします。
グレン_b-モニカの復活14

@Glen_b説明ありがとうございます。バカなことをしていない限り、Vは擬似ではなく、推定分位数に関する重み付き偏差の合計のように見えます。R2
Dimitriy V. Masterov

@Dimitriyあー、あなたは正しい、私は何かを省いた。これはすぐに修正します。
グレン_b-モニカーの復活2014

@Dimitriy今修正しました。
グレン_b-モニカの復活14

19

JASAのKoenker and Machado(1999)によって提案された擬似尺度は、対象モデルの加重偏差の合計を、切片のみが現れるモデルからの同じ合計と比較することにより適合度を測定します。として計算されますR2

R1(τ)=1yiy^iτ|yiy^i|+yi<y^i(1τ)|yiy^i|yiy¯τ|yiy¯|+yi<y¯i(1τ)|yiy¯|,

ここで、は観測値近似番目の分位数で、は切片のみからの近似値ですモデル。τI ˉ Y =βτy^i=ατ+βτxτiy¯=βτ

[ 0 1 ] τ R 2R1(τ)はにある必要があります。1は、偏差の加重和で構成される分子がゼロになるため、完全な適合に対応します。またローカルそれが依存するためQRMのための適合性の尺度グローバルとは異なり、 OLSから。それは間違いなく、それを使用することに関する警告の原因です。モデルがテールに収まる場合、それが他の場所にうまく収まるという保証はありません。このアプローチは、ネストされたモデルを比較するためにも使用できます。[0,1]τR2

Rの例を次に示します。

library(quantreg)
data(engel)

fit0 <- rq(foodexp~1,tau=0.9,data=engel)
fit1 <- rq(foodexp~income,tau=0.9,data=engel)

rho <- function(u,tau=.5)u*(tau - (u < 0))
R1 <- 1 - fit1$rho/fit0$rho

これはおそらくもっとエレガントに達成できるでしょう。


数式はうまく表示されません。マイナス記号の入力後:R_1(\tau) = 1 - 􀀀最後の文字はある種の混乱です。確認してもらえますか?たぶん、Texを使用する代わりに非標準文字を貼り付けたのかもしれません
Tim

@Tim texでも画面でも、奇妙なものは見当たりません。
Dimitriy V. Masterov

LinuxとWindowsの両方で次のように表示されます。snag.gy
Tim

@Timそのボックスは何にも対応していないため、無視できます。後で別のマシンから編集してみます。
Dimitriy V. Masterov
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.