一貫性のない推定量は望ましいでしょうか?


22

一貫性は明らかに自然で重要なプロパティ推定器ですが、一貫性のある推定器よりも一貫性のない推定器を使用したほうがよい場合がありますか?

より具体的には、すべての有限(適切な損失関数に関して)に対して妥当な一貫性のある推定器よりも優れた一貫性のない推定器の例はありますか?n


1
モデル選択の一貫性と、投げ縄とその(多くの!)バリアントを使用した推定問題のパラメーターの一貫性の間には、パフォーマンスの興味深いトレードオフがあります。これは、たとえばビュールマンとファンデルギアの最近のテキストに詳しく説明されています。
枢機

私の、今削除された、答えの引数はまだ保持されませんか?すなわち、小さなサンプルでは、​​低分散の不偏推定量を使用することをお勧めします。または、一貫性のある推定量は、他の不偏推定量よりも常に分散が小さいことを示すことができますか?
ボブ・ヤンセン

おそらく、@ Bootvis!MSEが低い矛盾した推定量の例はありますか?
MånsT

3
@Bootvis:一貫性と不偏性について尋ねる最近の質問への回答に関する広範なコメントを見ると、一貫性のある推定器が分散とバイアスの両方の任意のワイルドな振る舞いを持っていることがわかります(同時にも!) 。それはあなたのコメントに関するすべての疑念を取り除くはずです。
枢機

私は2冊の本のうちの1冊から持っていたと思ったが、どうやらそれについても間違っていた!例はどこにも見つかりません。@cardinal:おもしろそうですね、チェックしてみてください
ボブ・ヤンセン

回答:


25

この回答は、自然な一貫性のある推定量が一貫性のない推定量によって支配されている(すべてのサンプルサイズのすべての可能なパラメータ値よりも優れている)現実的な問題を説明しています。整合性は2次損失に最適であるという考えに基づいているため、それから大きく外れた損失(非対称損失など)を使用すると、推定器のパフォーマンスの評価において整合性がほとんど役に立たなくなるはずです。


クライアントがiidサンプルから変数の平均(対称分布を持つと仮定)を推定したいが、(a)過小評価または(b)過度に過大評価のいずれかを嫌うとしますそれ。バツ1バツn

これがどのように機能するかを確認するために、単純な損失関数を採用し、実際には損失が定量的に(定性的ではなく)損失と異なる場合があることを理解しましょう。ように測定単位を選択して最大許容過大評価であると推定の損失設定さTを真の平均である場合μ同等に0たびμ T μ + 1に等しい1別段。1tμ0μtμ+11

計算は、平均と分布の正常な家族のために特に簡単であり及び分散σ 2 > 0、サンプル平均ため、ˉ X = 1μσ2>0通常有しているμσ2/N分布。サンプル平均は、よく知られている(そして明白な)μの一貫した推定量です。書き込みΦ標準正規CDFのために、サンプルの平均対等の予想損失1/2+Φ-バツ¯=1nバツμσ2/nμΦ1/2は、サンプルの平均が真の平均と過小評価することを50%の確率から来Φを-1/2+Φn/σ1/2は、真の平均を1を超えて過大評価する可能性に由来します。Φn/σ1

損失

の予想損失は、この標準の標準PDFの下の青い領域に等しくなります。赤い領域は、下の代替推定器の予想される損失を示します。これらは間固体青色領域を置換することによって異なる- バツ¯0との間の小さい固体赤色領域によってn/2σ0n/2σ。この差は、nが増加するにつれて大きくなります。n/σn

与えられる別の推定の予想損失有する2 Φを- バツ¯+1/2。正規分布の対称性と単峰性は、その予想される損失がサンプル平均の損失よりも常に優れていることを意味します。(これはサンプル平均なる許容できないこの損失のために。)実際、サンプル平均の予想損失は、下限有する1/2とは別の収束のに対し0としてN成長します。しかし、代替は明らかに矛盾している:として、nが大きくなる、それはへの確率に収束μ+1/2μ2Φn/2σ1/20nnμ+1/2μ

損失関数

バツ¯バツ¯+1/2n


2
L2L2

5
@Macro思考はやや間接的であり、厳密であることを意図していませんが、自然だと思います。二次損失は分散を最小化することを意味し、チェビシェフを介して確率の収束につながります。反例を見つけるための発見的方法は、二次的ではなく、そのような操作が失敗するほど遠くにある損失に焦点を当てるべきです。
whuber

1
1/20n

3
@Michael OK、それを説明してくれてありがとう。このコンテキストでは、非2次損失では、「利点」はバイアスの用語で表されません。この損失関数を批判するかもしれませんが、私はそれを完全に拒否したくありません:たとえば、データが特定の許容範囲で製造されたアイテムの測定値であり、それが悲惨な状況になることをモデル化します(シャトルOリングの障害のように)またはビジネスの破産は悲惨です)真の意味がこれらの許容範囲外になるためです。
whuber

1
(+1)素晴らしい答え、@ whuber!私は特に、それがあまりにも病的ではないことを気に入っています-この種の損失が適用される多くの状況を考えることができます。
MånsT
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.