回答:
この質問は、基礎となる分布がどのようなものであっても、損失最小化として特定の分位を生成する損失関数をどのように考え出すかについての洞察を求めることとして理解しています。この特定の損失関数が機能することを示すウィキペディアまたは他の場所で 分析を繰り返すだけでは不十分です。
なじみのあるシンプルなものから始めましょう。
あなたが話しているのは、データFの分布またはセットに関連する「場所」見つけることです。それは、平均こと、例えば、よく知られているˉ xが期待二乗残差を最小化します。つまり、それは値です
可能な限り小さいです。私はそれを思い出させるために、この表記を使用している由来しているの損失それはによって決定されていることを、Fが、最も重要なことは、数に依存ˉ Xです。
ことを示すために、標準的な方法任意の関数がときに、関数の値が減少しない実証することによって始まる最小限のx *が少しだけ変化します。このような値は、関数のクリティカルポイントと呼ばれます。
どのような損失関数が、パーセンタイルF − 1(α )が臨界点になるのでしょうか?その値の損失は
これが重要なポイントであるためには、その導関数はゼロでなければなりません。私たちはいくつかの解決策を見つけるためにしようとしているので、私たちは、操作が正当であるかどうかを確認するために一時停止しません。我々は、(私たちは本当に区別できるかどうかなど、技術的な詳細をチェックすることを計画します、などを最後にします)。かくして
左側では、の引数は負ですが、右側では正です。それ以外は、Fは任意の分布関数になる可能性があるため、これらの積分の値をほとんど制御できません。 結果的に私たちの唯一の希望は作ることですΛを「引数の符号にのみ依存し、それ以外の場合は一定でなければなりません。
これは、が区分線形であり、潜在的にゼロの左右に異なる勾配を持つことを意味します。ゼロに近づくにつれて明らかに減少するはずです。結局のところ、それは損失であってゲインではありません。また、再スケーリングΛを我々は左側のスロープを設定して自由に感じるかもしれので、そのプロパティを変更しません定数で- 1。してみましょうτ > 0、右側の斜面こと。それから(1 )に簡素化します
そこからユニークなソリューションは、正の整数倍にアップしています
分母をクリアするには、問題の提示損失関数を生成します。
If you want to get an intuitive sense of why minimizing this loss function yields the th quantile, it's helpful to consider a simple example. Let be a uniform random variable between 0 and 1. Let's also choose a concrete value for , say, .
So now the question is why would this loss function be minimized at ? Obviously, there's three times as much mass in the uniform distribution to the right of than there is to the left. And the loss function weights the values larger than this number at only a third of the weight given to values less than it. Thus, it's sort of intuitive that the scales are balanced when the th quantile is used as the inflection point for the loss function.