連続分布からサンプリングされたデータの「モード」を適合させる最良の方法は何ですか?
モードは技術的には未定義(右?)であるため、連続分布では「最も一般的な値をどのようにして見つけるのか」と本当に質問しています。
親分布がガウス分布であると仮定した場合、データをビンに分類すると、モードが最大カウントのビン位置であるとわかります。しかし、ビンのサイズはどのように決定しますか?堅牢な実装はありますか?(つまり、外れ値に対して堅牢)。私はpython
/ scipy
/ を使用しますnumpy
が、おそらくR
それほど難なく翻訳できます。