ベイズの信頼できる区間手順の決定理論的正当化とは何ですか?


20

(これを書いた理由を見るには、この質問に対する私の答えの下にあるコメントをチェックしてください。)

タイプIIIエラーと統計的決定理論

間違った質問に正しい答えを与えることは、タイプIIIエラーと呼ばれることもあります。統計的決定理論は、不確実性の下での意思決定の形式化です。タイプIIIエラーの回避に役立つ概念的なフレームワークを提供します。フレームワークの重要な要素は損失関数と呼ばれます。これには2つの引数があります。1つ目は(関連するサブセットの)世界の真の状態です(たとえば、パラメーター推定問題では、真のパラメーター値θ)。2番目は、可能なアクションのセットの要素です(たとえば、パラメーター推定問題では、推定θ^)。出力は、世界のあらゆる可能な真の状態に関するあらゆる可能なアクションに関連する損失をモデル化します。たとえば、パラメータ推定問題では、いくつかのよく知られている損失関数は次のとおりです。

  • 絶対誤差損失L(θ,θ^)=|θθ^|
  • 二乗誤差損失L(θ,θ^)=(θθ^)2
  • Hal VarianのLINEX損失L(θ,θ^;k)=exp(k(θθ^))k(θθ^)1, k0

答えを調べて質問を見つける

正しい損失関数の定式化に焦点を合わせ、決定論的アプローチの残りの部分を進めることで、タイプIIIのエラーを回避しようとする場合があります(ここでは詳しく説明しません)。簡単なことではありません。結局のところ、統計学者は、こうしたアプローチから派生していなくても、うまく機能する多くの手法と方法を十分に備えています。しかし、最終結果は、統計学者の大多数が統計的決定理論を知らず、気にしないということであり、見逃していると思います。それらの統計学者にとって、タイプIIIエラーを回避するという点で統計的決定理論が有益であると考える理由は、提案されたデータ分析手順を求めるフレームワークを提供するためだと主張します。プロシージャはどの損失関数(もしあれば)に最適に対処しますか?つまり、どのような意思決定状況において、正確に、それが最良の答えを提供しますか?

事後予想損失

ベイジアンの観点からは、損失関数だけが必要です。私たちはかなり決定理論の残りの部分をスキップすることができます-ほとんどの定義により、行うための最善のことは、損失を最小限事後期待している、あること、行動見つけるaその最小化L~(a)=ΘL(θ,a)p(θ|D)dθ

?具体的には、ワルドの- (非ベイズ視点まあ用として、それはfrequentist決定理論の定理である完全なクラス定理こと- 最適なアクションが常にすることになりますベイズ事後予想損失を最小限に抑えるに関していくつか)(おそらく不適切この結果の難しさは、それが存在する定理が使用する前にどのガイダンスについても与えないことであるが、それは私たちがどの質問であるかを正確に把握するために「反転」できる手順のクラスを実に制限する特に、非ベイジアン手順を逆変換する最初のステップは、どのベイジアン手順を複製または近似するか(ある場合)を把握することです。)

ねえ、シアン、これはQ&Aサイトだよね?

最後に統計的な質問に私をもたらします。ベイジアン統計では、単変量パラメーターの間隔推定値を提供する場合、2つの一般的な信頼できる間隔手順は、分位に基づく信頼できる間隔と最高事後密度の信頼できる間隔です。これらの手順の背後にある損失関数は何ですか?


非常に素晴らしい。しかし、それらはこれらの手順を正当化する唯一の損失関数ですか?
ゲスト

1
@Cyan >>質問をしてくれてありがとう。私はこれをすべて読んで、可能な限り投票する。
ステファンローラン

4
ベルガーさんからの興味深い引用統計的決定理論とベイズ分析:「我々は明確な決定理論的な役割を持つものとして信頼性の高いセットを表示するため、 『最適』の警戒心を抱いているしていない信頼性の高いセットの選択へのアプローチ」
サイモン・バーンズ

1
@Simon Byrne >> 1985年は昔です。彼はまだそれを考えているのだろうか。
シアン

1
@Cyan:わかりませんが、決定理論は、過去27年間あまり変化していないベイジアン統計の一部です(興味深い結果がいくつかありますが、Bergerの本はまだ標準的な参照です)人気のミニマックスと比較すると、頻度の高い統計が得られます。
サイモンバーン

回答:


15

単変量間隔推定では、可能なアクションのセットは、間隔のエンドポイントを指定する順序付きペアのセットです。そのセットの要素が表されるとする(a,b), ab

最高の後方密度間隔

事後密度を。事後密度の最も高い間隔は、真の値を含まない間隔にペナルティを与える損失関数に対応し、その長さに比例して間隔にもペナルティを与えます。f(θ)

LHPD(θ,(a,b);k)=I(θ[a,b])+k(ba),0<kmaxθf(θ)

ここで、はインジケーター関数です。これにより、予想される事後損失が得られますI()

L~HPD((a,b);k)=1Pr(aθb|D)+k(ba)

設定 Aの収率必要条件パラメーター空間の内部での局所最適: –予想通りのHPD間隔の正確なルール。aL~HPD=bL~HPD=0f(a)=f(b)=k

の形式は、HPD間隔がパラメーターの単調増加変換に不変でない理由についての洞察を与えます。 -space HPD間隔に変換空間が異なる 2つの間隔が異なる損失関数に対応するので-space HPD間隔: -space HPD間隔に相当します形質転換された長さペナルティ。L~HPD((a,b);k)g(θ)θg(θ)g(θ)g(θ)k(g(b)g(a))

分位ベースの信頼できる間隔

損失関数を使用したポイント推定の検討

Lq(θ,θ^;p)=p(θ^θ)I(θ<θ^)+(1p)(θθ^)I(θθ^), 0p1

事後予想損失は

L~q(θ^;p)=p(θ^E(θ|θ<θ^,D))+(1p)(E(θ|θθ^,D)θ^)

設定収率暗黙式ddθ^L~q=0

Pr(θ<θ^|D)=p

つまり、最適なは、予想通り、事後分布の%分位数です。100Pθ^(100p)

したがって、変位値ベースの間隔推定値を取得するには、損失関数は

LqCI(θ,(a,b);pL,pU)=Lq(θ,a;pL)+Lq(θ,b;pU)


1
これを動機付けるもう1つの方法は、損失関数を、間隔の幅と距離(存在する場合)の(加重)合計として書き直し、それによって間隔が真のをカバーできないことです。θ
ゲスト

変位値または間隔の長さを直接参照しない変位値ベースの間隔を考える他の方法はありますか。「分位間隔が平均値/最小値/最大値などを測定/最小化する」などの何かを期待していました
ラスマスバース2014年

@RasmusBååth、基本的には、「分位間隔が事後予測損失の最小化の解決策となるための損失関数に必要な条件は何ですか?」私の直感は、数学が順方向に働く方法からだけで、これはほとんどそれであるということです。しかし、それを証明していません。
シアン

したがって、損失関数についてはわかりませんが、ポイント損失関数に応じてHPDまたは分位間隔のいずれかになる手順を知っています。あなたは、ランダムなサンプルがあると後部からドロー。1. 後方損失が最小点をで選択し、その点を間隔に追加します。2.からそのポイントを削除します。この削除により、残りのポイントの事後損失が変化する可能性があります(依存)。3.間隔に必要なカバレッジがある場合は満足し、そうでない場合は(1)から繰り返します。L = L0はHPDを提供し、L = L1は分位間隔を提供します。s s s s LLssssL
ラスマスバース2014年

5
ただのセクション5.5.3ことを言及するベイジアン選択肢が ...信用できるセットの損失ベースの派生をカバー
西安

1

最小サイズの間隔

区間選択(ベイジアンとフリークエンシーの両方)の損失関数の明らかな選択の1つは、周辺分布の観点から測定される区間のサイズを使用することです。したがって、目的のプロパティまたは損失関数から始めて、最適な間隔を導き出します。これは可能ですが、現在の質問で例示されているように、行われない傾向があります。ベイジアンの信頼できるセットの場合、これは区間の事前確率を最小化するか、たとえばEvans(2016)で概説されているように相対的な信念を最大化することに対応します。サイズは、頻度主義者の信頼セットを選択するためにも使用できます(Schafer 2009)。2つのアプローチは関連しており、ポイント単位の相互情報を含む決定を優先的に含む決定ルールを介してかなり簡単に実装できます(Bartels 2017)。

Bartels、C.、2017。頻繁なテストでの事前知識の使用。figshare。 https://doi.org/10.6084/m9.figshare.4819597.v3

Evans、M.、2016。相対信念を使用した統計的証拠の測定。計算および構造バイオテクノロジージャーナル、14、pp.91-96。

Schafer、CMおよびStark、PB、2009。最適な予想サイズの信頼領域の構築。Journal of the American Statistical Association、104(487)、pp.1080-1089。


Keith O'Rourkeの提案(andrewgelman.com/2016/07/17/…)ごとにEvansを引用しているようです。私はエヴァンスのものが本当に好きです。
シアン

キースから、異なるように始まりますが、同様の結論に至る作業についての情報を受け取ったことを非常に嬉しく思います!これを引用することが重要です。
user36160
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.