パーセンタイル損失関数


11

問題の解決策:

minmE[|mX|]

Xの中央値として知られていますが、X他の百分位数の損失関数はどのように見えますか?例:Xの25パーセンタイルは、以下に対するソリューションです。

minmE[L(m,X)]

この場合、Lは何ですか?

回答:


12

Iインジケーター関数にしましょう:真の引数の場合は1、それ以外の場合は0です。ピック0<α<1と組

Λα(x)=αxI(x0)(1α)xI(x<0).

図

この図は\ Lambda_ {1/5}をプロットしていますΛ1/5。それはあなたが等しい斜面、ゲージを助けるために、正確なアスペクト比を使用しています4/5左側と+1/5右側にします。この場合、0を超えるエクスカーションは、0未満のエクスカーションと比較して大幅にダウンウェイトされます0

これは、重みの値があるためしようとする本来の機能である超えているは異なるよりも未満です。関連する損失を計算し、それを最適化しましょう。x0x0

書き込みの分布関数のと設定、計算FXLα(m,x)=Λα(xm)

EF(Lα(m,X))=RΛα(xm)dF(x)=αRI(xm)(xm)dF(x)(1α)R(xm)I(x<m)dF(x)=αm(xm)dF(x)(1α)m(xm)dF(x).

図2

以下のように標準正規分布と、この図に変動、合計確率加重領域プロットされています。(曲線はのグラフです。)の右側のプロットは、正の値のダウンウェイトの影響を最も明確に示しています。原点について対称である。真ん中のプロットは、青インクの総量()が可能な限り少ない最適値を示しています。mFΛ1/5Λ1/5(xm)dF(x)m=0EF(L1/5(m,X)) 

この関数は微分可能であるため、臨界点を調べることによってその極値を見つけることができます。誘導体を得るために連鎖法則と微分積分学の基本定理を適用与えますm

mEF(Lα(m,X))=α(0mdF(x))(1α)(0mdF(x))=F(m)α.

連続分布の場合、これは常にソリューションを持ちます。これは、定義により、分位数です。非連続的な分布のために、このかもしれないが、溶液を有するが、少なくとも一つが存在することになるないれるのためのすべて及びに対するすべて:これも(定義により)分位数です。mαXmF(x)α<0x<mF(x)α0xmαX

最後に、とであるため、ももこの損失を最小化しないことは明らかです。これは重要なポイントの検査を使い果たし、であることを示しています。α0α1mmΛα

特殊なケースとして、は、質問。EF(2L1/2(m,X))=EF(|mx|)


予想される損失が正しいポイントによって最小化されることを示すためにあなたが費やした努力に感謝します。自分の答えを自分でどうしたらいいのかと思っていたのですが、あなたの説明はいいです。(+1)m

2
あなたは写真が1000語の価値があることを証明しました。ありがとう@whuber =)
Cam.Davidson.Pilon 2014年

8

この記事にはあなたの答えがあります。具体的には、 損失関数は、0.25-の減算により、付近のさまざまな確率質量領域を「バランス調整」すると解釈できます。中央値の場合、これらの質量領域は等しくなります: 損失関数を比例させます(予想では定数は無視できます) 中央値の望ましい結論を与えます。

L0.25(m,X)=|(Xm)(0.251{X>m})|.
0.250.251{X>m}
L0.5(m,X)=|(Xm)(0.51{X>m})|=|(Xm)×±0.5|,
|Xm|,

(+1)よくできました!-そのウィキペディアの記事をどこで探すかは明らかではありませんでした。あなたは分位回帰について考えなければなりませんでした。
whuber

おかげで、@マシュー、これは素晴らしい発見です。私は解釈のバランスをとるのが好きです
Cam.Davidson.Pilon 2014年

まだ理解できません。これはどこから来たのですか?Xが分位点を上回っている場合、は0.75に重み付けされ、それ以外の場合は0.25になりますか?それだけ?|(0.25)1X>m)|(Xm)
IcannotFixThis 2015年
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.