過適合についてのベイジアン思考


20

私は、従来の頻度主義統計ドメインで予測モデルを検証するための方法ソフトウェアの開発に多くの時間を費やしました。より多くのベイジアンのアイデアを実践と教育に取り入れる際に、受け入れるべき重要な違いがいくつかあると思います。まず、ベイジアン予測モデリングはアナリストに、候補の特徴に合わせてカスタマイズできる事前分布についてよく考えるように頼みます。これらの事前分布は、モデルをそれらに引き寄せます)。第二に、「実際の」ベイジアンの方法では、単一のモデルにはなりませんが、予測のために事後分布全体を取得します。

これらのベイジアン機能を念頭に置いて、過剰適合とはどういう意味ですか?評価すべきでしょうか?もしそうなら、どのように?ベイズのモデルが野外での使用に信頼できるときはどのようにして知ることができますか?それとも、予測のために開発したモデルを使用すると、事後はすべての注意を与える不確実性に沿って進むので、それは重要なポイントですか?

ベイジアンモデルを単一の数値、たとえば事後平均/最頻値/中央値リスクに蒸留するように強制した場合、考え方はどのように変わりますか?

ここに関連する考え方があります。パラレル議論を見つけることができるここに

フォローアップの質問::完全にベイジアンであり、データを見る前に事前確率について考えるのに時間を費やし、データ尤度が適切に指定されたモデルに適合した場合、過剰適合に関してモデルに満足することを強いられますか?または、ランダムに選択された対象が平均して十分に予測される可能性のある頻繁な世界で行うことを行う必要がありますが、予測が非常に低い対象または予測値が非常に高い対象を選択すると、回帰が発生しますという意味ですか?



回答:


6

ベイジアンモデルは、前の予測分布から引き出されたデータを体系的にオーバーフィット(またはアンダーフィット)できないと言うことから始めるかもしれません。これは、ベイジアンソフトウェアが収集されたデータに適用される前に正しく動作していることを検証する手順の基礎です世界。

ただし、条件付きのデータに適用されるさまざまな予測測定値が、将来のデータに適用される同じ予測測定値よりも良く見えるという意味で、以前の予測分布から引き出された単一のデータセットまたは世界から収集された単一のデータセットをオーバーフィットできます同じプロセスで生成されます。Richard McElreathのBayesian の第6章は、過剰適合に専念しています。

過適合の重大度と頻度は、特に効果の規模に関する情報が豊富な事前優先順位によって軽減できます。信じられないほど大きな値に消滅する事前確率を置くことにより、事後分布が、信じられないほど大きな効果を示唆する可能性のあるデータの特異な側面によって過度に興奮することを思いとどまらせます。

オーバーフィッティングを検出する最良の方法は、1組の交差検定を含みます。これは、条件セットから実際に観測値を残さない事後分布から近似できます。条件付けする個々の「観測」[*]が事後分布に過度に大きな影響を与えないという仮定がありますが、その仮定は、重要度サンプリング重み(事後分布からのすべての引き分けにわたって評価される観測の対数尤度から導出される)に適合します。この仮定が満たされている場合は、各観測値について、その観測値が省略されているかのように予測測定値を取得できます。残りは、残りの観測に基づいて条件から引き出され、後の予測分布は、省略された観測に対して構築されました。除外された観測値の予測に問題がある場合、モデルは最初から過剰適合していました。これらのアイデアは herethereなどの引用を含むRのloo パッケージ

単一の数値に蒸留する限り、50%の予測間隔内に収まる観測値の割合を計算したいと思います。この比率が半分よりも大きい場合、モデルは過剰適合しますが、包含インジケーター関数のノイズをカットするには、少数の観測が必要です。異なるモデル(過剰適合の可能性がある)を比較するために、期待される対数予測密度(ループloo内の関数によって計算されます)パッケージ)は、より柔軟なモデルが、柔軟性の低いモデルよりも利用可能なデータによりよく適合する可能性を考慮に入れるが、将来のデータをより悪く予測すると予想されるため、(IJ Goodによって提案された)良い尺度です。しかし、これらのアイデアは、予測尺度の予測に適用できます(実務者にとってより直感的かもしれません)。looパッケージのE_loo関数を参照してください。

[*]階層モデルで観測を構成するものを選択する必要があります。たとえば、既存の患者の新しい患者または新しい時点を予測することに興味がありますか?どちらの方法でも実行できますが、前者では、尤度関数を(再)作成して、患者固有のパラメーターを統合する必要があります。


2
非常に有益なベン。詳細に対応していただき、ありがとうございます。スコープに関するあなたの質問に答えるために、私は新しい患者に言及しています。元の質問の最後に追加した一般的な哲学的質問が残っています。
フランクハレル

2
このようなチェックは、使用した以前の分布に組み込まなかった、または組み込むことができなかったという以前の信念の側面を反映していると考える傾向があります。例えば、原則的に、あなたはすべてのパラメータを超える共同前にPDFを指定する必要がありますが、ほとんどいつも、これはそのとは無関係であることを仮定してのたくさんある先験的には、あなたが本当に彼らが独立しているが、指定するという理由だけで信じていないので、多変量依存構造は非常に困難です。予測などの多変量関数は、入力が合同であるかどうかを事実の後に伝えるのに役立ちます。
ベングッドリッチ

それは非常に理にかなっており、非常に洞察力に富んでいます。「極端な」被験者、つまり非常に低いまたは非常に高い予測値を持つ被験者の予測精度の評価については、まだ少し疑問が残っています。[そして、値予測したベイズの場合。後部分布がシフトした被験者ですか、それとも後部平均値が低い/高い被験者ですか?]
フランクハレル

1
これについての別の考え:多くの状況で、開業医はベイズ規則の分母についてかなり一貫した論争のない信念を持っているようです。たとえば、誰かがこの癌またはその癌を患っている場合、他に何も条件付けしない場合の生存時間の分布はどうですか?しかし、すべてのパラメーターを統合すると、分母と思われるものが残るように、ベイズ規則の分子を指定するのは難しく、より議論の余地があります。予測チェック(前と後の両方)は、分子をベイズ規則の分母に合わせる一種の方法です。
ベングッドリッチ

1

過適合とは、トレーニングセットではモデルが適切に機能するが、テストセットではパフォーマンスが低下することを意味します。私見、それは2つのソースから来ています:データと私たちが使用するモデル(または私たちの主観)。

k

結果として、もし我々が頻繁にいるのであれば、過剰適合の原因はMLEにあります。ベイジアンの場合、これは事前分布の(主観的な)選択(およびもちろん尤度の選択)に由来します。したがって、事後分布/平均/中央値を使用した場合でも、最初からオーバーフィットしているため、このオーバーフィッティングは引き継がれます。事前分布と尤度の適切な選択が役立ちますが、それらは依然としてモデルであり、過剰適合を完全に回避することはできません。


頻繁なアプローチとベイジアンアプローチに共通するデータの可能性を無視すると、オーバーフィッティングは事前確率の選択から生じるという考えは洞察に富んでいます。つまり、事前適合について事前データの思考をすべて行った場合、事前適合を確認する方法も必要もないため、過剰適合を確認する方法がないことを意味します。しかし、それでも、極端な予測は過剰適合(平均への回帰)を示すという沈没感が残ります。事前条件はパラメーターに関するものであり、データの極端なものではありません。
フランクハレル
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.