私が使用していますquantregのデータセットで私の値の99パーセンタイルを使用して回帰モデルを作るために、パッケージを。以前に尋ねたstackoverflowの質問からのアドバイスに基づいて、私は次のコード構造を使用しました。
mod <- rq(y ~ log(x), data=df, tau=.99)
pDF <- data.frame(x = seq(1,10000, length=1000) )
pDF <- within(pDF, y <- predict(mod, newdata = pDF) )
データの上にプロットして表示します。ポイントのアルファ値とともに、ggplot2を使用してこれをプロットしました。私の分析では、分布の裾が十分に考慮されていないと思います。おそらくこれは、パーセンタイル型の測定では無視されている個々のポイントがあるためです。
コメントの1つは、
パッケージビネットには、非線形変位値回帰に関するセクションと、平滑化スプラインなどのモデルが含まれています。
前の質問に基づいて、対数関係を仮定しましたが、それが正しいかどうかはわかりません。99パーセンタイル間隔ですべてのポイントを抽出して個別に調べることができると思いましたが、それを行う方法、またはそれが良いアプローチかどうかはわかりません。この関係の特定を改善する方法についてのアドバイスをいただければ幸いです。