タグ付けされた質問 「quantile-regression」

変位値回帰により、結果変数または特定の変位値の分布全体にわたる一連の予測変数の効果を推定できます。

2
条件付きおよび無条件の変位値回帰の違いは何ですか?
τt hτth\tau^{th} ρτ=UI⋅(τ-1(UI&lt;0))、UiがβˆQ R= 分b∑i = 1nρτ(y私− X′私bτ)β^QR=minb∑i=1nρτ(yi−Xi′bτ) \widehat{\beta}_{QR} = \min_{b} \sum^{n}_{i=1} \rho_\tau (y_i - X'_i b_\tau) ρτ= あなた私⋅ (τ− 1 (u私&lt; 0 )))ρτ=ui⋅(τ−1(ui&lt;0))\rho_\tau = u_i\cdot (\tau - 1(u_i<0))あなたは私uiu_i Firpo等による論文で。(2009)、著者は、条件付き分位回帰は興味深い効果をもたらさないと述べています。彼らは、条件付きの結果を母集団に一般化することはできないと言います(OLSでは、反復期待の法則によって条件付きから無条件にいつでも移行できますが、これは変位値には使用できません)。これは、τt hτth\tau^{th}無条件変位値y私yiy_iがτt hτth\tau^{th}条件変位値y_i | X_iと同じではない可能性があるためy私| バツ私yi|Xiy_i |X_iです。 正しく理解できれば、問題の一部は、共変量を含めるとエラーが観測成分と非観測成分に分割されるため、X_iに含まれる共変量がバツ私XiX_iランキング変数u_iに影響するあなたは私uiu_iことです。これが問題を引き起こす理由を私はまったく理解できません。 私の質問は次のとおりです。 条件付きおよび無条件の分位効果が互いに異なるのはなぜですか? 条件付き分位点回帰の係数をどのように解釈できますか? 条件付き分位点回帰は偏っていますか? 参照: Koenker、R.、&Bassett、G.(1978) "Regression Quantiles"、Econometrica、Vol。46(1)、33-50ページ。 Firpo、S. et al。(2009)「無条件分位点回帰」、エコノメトリック、Vol。77(3)、953〜973ページ。

1
分位点回帰:どの標準エラーですか?
quantreg vignetteのsummary.rq関数は、分位点回帰係数の標準誤差推定のための多数の選択肢を提供します。これらのそれぞれが最適/望ましいものになる特別なシナリオは何ですか? Koenker(1994)で説明されているようにランクテストを反転することにより、推定パラメーターの信頼区間を生成する「ランク」。デフォルトのオプションは、エラーがiidであると想定していますが、オプションiid = FALSEはKoenker Machado(1999)の提案を実装しています。追加の引数については、rq.fit.brのドキュメントを参照してください。 エラーがiidであると想定し、KB(1978)のように漸近共分散行列の推定値を計算する「iid」。 条件付き分位関数のローカル(タウ)線形性(x)を推定し、スパース性のローカル推定を使用してフーバーサンドイッチ推定を計算する「nid」。 Poker(1990)によって提案されたサンドイッチのカーネル推定値を使用する「ker」。 標準エラーを推定するためのいくつかの可能なブートストラップの選択肢の1つを実装する「ブート」。 私はこれが時系列または断面の次元のいずれかに適用される少なくとも20の経験的論文を読みましたが、標準誤差の選択については言及していません。

1
分位回帰にはどのような診断プロットが存在しますか?
OLSに関する私の質問に続いて、私は疑問に思う:分位回帰にはどのような診断プロットが存在するのか?(そしてそれらのR実装はありますか?) 簡単なグーグル検索で、すでにワームのプロット(これまで聞いたことがない)を思い付きました。(それらのうちのどれかが、分位点回帰のために移植されたOLSからのものですか?)

2
分位点回帰はどのように「機能」しますか?
クォンタイル回帰の直感的でアクセス可能な説明を得たいと思っています。 結果単純なデータセットと、予測子ます。YYYX1,X2X1,X2X_1, X_2 たとえば、.25、.5、.75で変位値回帰を実行し、。β0,.25,β1,.25...β2,.75β0,.25,β1,.25...β2,.75\beta_{0,.25},\beta_{1,.25}...\beta_{2,.75} されている値は、単に注文した値を、与えられた分位の近くに/にある例に基づいて線形回帰を実行しますか?ββ\betayyy または、すべてのサンプルは、分位点からの距離が増加するにつれて重みが降順になり、推定値に寄与しますか?ββ\beta それともまったく違うものですか?わかりやすい説明はまだ見つけていません。

2
分位点回帰:損失関数
分位点回帰を理解しようとしていますが、私が苦しむ1つのことは、損失関数の選択です。 ρτ(u)=u(τ−1{u&lt;0})ρτ(u)=u(τ−1{u&lt;0})\rho_\tau(u) = u(\tau-1_{\{u<0\}}) 私はの期待の最小ことを知っているに等しいτ % -quantileが、この機能をオフに開始するための直感的な理由は何ですか?この関数の最小化と変位値の関係はわかりません。誰かが私にそれを説明できますか?ρτ(y−u)ρτ(y−u)\rho_\tau(y-u)τ%τ%\tau\%

2
分位点回帰モデルの調整済みようなものはありますか?
論文に変位値回帰モデルを含めたので、査読者は、調整済みのを論文に含めたいと思っています。私の研究で興味のある3つの分位数について、疑似を計算しました(KoenkerとMachadoの1999 JASA論文から)。R2R2R^2R2R2R^2 ただし、分位点回帰用に調整されたについて聞いたことがなく、その計算方法がわかりません。次のいずれかをお願いします。R2R2R^2 好ましくは、分位点回帰の調整済みを有意義に計算する方法に関する式またはアプローチ。R2R2R^2 あるいは、分位点回帰で調整されたようなものがない理由について、レビューアーに提供する説得力のある議論。R2R2R^2

5
分位点回帰がOLSより悪いのはいつですか?
条件付き平均関係を絶対に理解しなければならないいくつかのユニークな状況とは別に、研究者が分位点回帰よりもOLSを選択すべき状況は何ですか? OLSの代替として中央値回帰を使用することができるため、「テール関係を理解するのに役に立たない場合」と答えたくありません。

2
分位点回帰におけるR二乗
変位値回帰を使用して、データの90パーセンタイルの予測変数を見つけています。これをRでquantregパッケージを使用して行っています。予測変数によってどの程度の変動が説明されているかを示す変位値回帰のを決定するにはどうすればよいですか?r2r2r^2 私が本当に知りたいこと:「どの程度の変動性が説明されているかを見つけるために使用できる方法は?」P値による有意水準は、コマンドの出力で使用可能です:summary(rq(formula,tau,data))。どうすればフィット感を得ることができますか?

3
IV分位回帰に関する文献
ここ数ヶ月、私はこの夏の修士論文の準備として、分位点回帰について集中的に読みました。具体的には、このトピックに関するRoger Koenkerの2005年の本のほとんどを読みました。ここで、この既存の知識を拡張して、計測変数(IV)を可能にする分位点回帰手法にしたいと思います。これは活発な研究分野であり、急速に成長しているようです。 誰かが私に提案することができます: IV分位回帰に関する論文またはその他の文献 これらのさまざまな統計手法の概要 さまざまな手法の長所と短所 私は主に文学を探して、始めて、そこにあるものの良い概要を持っています。したがって、最初のポイントは重要なポイントです。2つ目と3つ目は良いでしょう!また、私の関心は主に断面法にありますが、パネル法も歓迎します。 前もって感謝します。

3
分位点回帰に対する線形回帰の利点は何ですか?
線形回帰モデルがあること仮定の束になりクォンタイル回帰は、線形回帰の仮定が満たされた場合、ないとし、その後、私の直感(およびいくつかの非常に限られた経験が)中央値回帰は、線形回帰とほぼ同じ結果を与えるだろうということです。 それでは、線形回帰にはどのような利点がありますか?それは確かにより馴染みがありますが、それ以外は?

2
分位モデリングのモデルパフォーマンス
私は分位点回帰を使用しています(たとえば、R を介して、gbmまたはquantregRで)-中央値ではなく、上位の分位点(たとえば75番目)に焦点を当てています。予測モデリングの背景から、モデルがテストセットにどの程度適合するかを測定し、これをビジネスユーザーに説明できるようにします。私の質問はどうですか?継続的なターゲットの典型的な設定では、次のことができます。 全体のRMSEを計算する データセットを予測値で十分位取りし、実際の平均値を各十分位数で予測された平均値と比較します。 等。 この場合、予測と比較する実際の値が実際にない(少なくとも考えていない)場合、何ができますか? コードの例を次に示します。 install.packages("quantreg") library(quantreg) install.packages("gbm") library(gbm) data("barro") trainIndx&lt;-sample(1:nrow(barro),size=round(nrow(barro)*0.7),replace=FALSE) train&lt;-barro[trainIndx,] valid&lt;-barro[-trainIndx,] modGBM&lt;-gbm(y.net~., # formula data=train, # dataset distribution=list(name="quantile",alpha=0.75), # see the help for other choices n.trees=5000, # number of trees shrinkage=0.005, # shrinkage or learning rate, # 0.001 to 0.1 usually work interaction.depth=5, # 1: additive …

2
非統計学者への分位点回帰の説明
最近、クォンタイル回帰を使用した論文を心理学ジャーナルに投稿しました。クォンタイル回帰の明確な説明にはすでに十分な考えを入れていたと思いますが、レビュアーは、標準OLS回帰のみに精通しているクォンタイル回帰手法のより良い説明を求めました。 それでは、経験的論文で非統計学者に分位点回帰を説明する最良の方法は何ですか?

2
分位点回帰予測
一部のモデルで変位値回帰を使用することに興味がありますが、この方法論を使用して何を達成できるかについて明確にしたいと思います。特に外れ値や不均一分散に直面している場合、IV / DV 関係のより堅牢な分析が得られることは理解していますが、私の場合は予測に焦点を当てています。 特に、より複雑な非線形モデルや区分的線形回帰に頼らずに、モデルの適合性を改善することに興味があります。予測では、予測子の値に基づいて最高確率の結果分位を選択することは可能ですか?言い換えると、予測子の値に基づいて、各予測結果の分位確率を決定することは可能ですか?

2
シンプレックス法で最小絶対偏差を解決するには?
argminwL(w)=∑ni=1|yi−wTx|arg⁡minwL(w)=∑i=1n|yi−wTx| \underset{\textbf{w}}{\arg\min} L(w)=\sum_{i=1}^{n}|y_{i}-\textbf{w}^T\textbf{x}| min∑ni=1uimin∑i=1nui\min \sum_{i=1}^{n}u_{i} ui≥xTw−yii=1,…,nui≥xTw−yii=1,…,nu_i \geq \textbf{x}^T\textbf{w}- y_{i} \; i = 1,\ldots,n ui≥−(xTw−yi)i=1,…,nui≥−(xTw−yi)i=1,…,nu_i \geq -\left(\textbf{x}^T\textbf{w}-y_{i}\right) \; i = 1,\ldots,n しかし、私はLPの初心者なので、段階的に解決する考えはありません。何かアイデアはありますか?前もって感謝します! 編集: これが私がこの問題に到達した最新の段階です。私はこのメモに続く問題を解決しようとしています: ステップ1:標準形式に定式化する minZ=∑ni=1uiminZ=∑i=1nui\min Z=\sum_{i=1}^{n}u_{i} xTw−ui+s1=yii=1,…,nxTw−ui+s1=yii=1,…,n \textbf{x}^T\textbf{w} -u_i+s_1=y_{i} \; i = 1,\ldots,n xTw+ui+s2=−yii=1,…,nxTw+ui+s2=−yii=1,…,n \textbf{x}^T\textbf{w} +u_i+s_2=-y_{i} \; i = 1,\ldots,n s_1 \ ge 0の対象s1≥0;s2≥0;ui≥0 i=1,...,ns1≥0;s2≥0;ui≥0 i=1,...,ns_1 \ge 0; s_2\ge 0; …

1
ロジスティッククォンタイル回帰–結果を最適に伝える方法
以前の投稿で、EQ-5Dスコアをどのように扱うかを考えました。最近、BottaiとMcKeownが提案したロジスティッククォンタイル回帰に出くわしました。式は簡単です: L O Gi t (y)= l o g(y− yM I nはymは、Xが− y)log私t(y)=log(y−ym私nymaバツ−y)logit(y)=log(\frac{y-y_{min}}{y_{max}-y}) 回避ログ(0)と0で除算するには、小さな値で範囲を拡張。これにより、スコアの境界を尊重する環境が得られます。ϵϵ\epsilon 問題は、すべてのがロジットスケールになり、通常のスケールに変換し直さなければ意味がないことですが、それはβが非線形であることを意味します。グラフ作成の目的では、これは重要ではありませんが、βの数が多い場合は問題になりません。ββ\betaββ\betaββ\beta 私の質問: フルスパンを報告せずにロジットを報告するにはどうすればよいですか?ββ\beta 実装例 実装をテストするために、この基本機能に基づいたシミュレーションを作成しました。 o u t c o m e = β0+ β1∗ x t e s t3+ β2∗ s e xoあなたはtcome=β0+β1∗バツtest3+β2∗seバツoutcome=\beta_0+\beta_1* xtest^3+\beta_2*sex ここで、、β 1 = 0.5及びβ 2 = 1。スコアには上限があるため、4以上および-1未満の結果値を最大値に設定しました。β0= 0β0=0\beta_0 = 0β1= 0.5β1=0.5\beta_1 …

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.