確率モデルを調整しながら最適なビン幅を選択する方法は?


12

背景:発生する結果の確率を予測するモデルを調整する方法について、いくつかの素晴らしい質問/回答があります。例えば

  1. ブライアースコア、および解像度、不確実性、信頼性への分解。
  2. 較正プロットと等張回帰

これらの方法では、予測結果に対するビニング方法の使用が必要になることが多く、結果(0、1)の振る舞いは、平均結果をとることによりビン上で平滑化されます。

問題: ただし、ビンの幅を選択する方法を教えてくれるものは見つかりません。

質問:最適なビン幅を選択するにはどうすればよいですか?

試行:使用されている2つの一般的なビンの幅は次のようです。

  1. 等幅ビニング、たとえば、間隔[0、1]の10%をカバーする10個のビン。
  2. ここで説明する Tukeyのビニング方法。

しかし、最も誤ってキャリブレーションされた予測確率の間隔を見つけることに関心がある場合、ビンのこれらの選択は最も最適ですか?


1
「1」の結果がまれな場合は、サンプルの数が同じではなく、「1」の数が等しいビンに分割することを検討する価値があります。キャリブレーション後にモデルの差別(AUC)を維持してこの缶ヘルプ
ihadanny

回答:


4

ビニングを使用する統計的方法は、最終的には時代遅れと見なされています。連続検量線の推定は、1990年代半ばから一般的に行われています。一般的に使用される方法は、レス(外れ値検出をオフにした)、線形ロジスティックキャリブレーション、およびスプラインロジスティックキャリブレーションです。これについては、Regression Modeling Strategiesブックとコースノートで詳しく説明します。http://www.fharrell.com/p/blog-page.htmlを参照してください。R rmsパッケージを使用すると、独立した外部サンプルを使用するか、元のモデル開発サンプルのブートストラップを使用して、スムーズなノンパラメトリック検量線を簡単に取得できます。


0

私の経験では、ビニングは確率分布を視覚化するのに適していますが、統計テストやパラメーター推論にifを使用する場合、通常は悪い考えです。主に、ビンの幅によって精度がすぐに制限されるためです。別の一般的な問題は、変数がバインドされていない場合、つまり、低いカットオフと高いカットオフを導入する必要がある場合です。

コルモゴロフ-スミルノフの精神で累積分布を扱うことは、これらの問題の多くを回避します。この場合、多くの優れた統計手法も利用できます。(https://en.wikipedia.org/wiki/Kolmogorov%E2%80%93Smirnov_testなどを参照)

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.