回答:
コード内のコメントは、2つを本質的に同一に定義しているように見えます(定数の比較的小さな違いは別として)。
両方の形式は、同じように見えるものの両方(スケールの推定)、およびの非常に近い1(最適帯域幅の推定における典型的な不確実性に近い相対)に。
[より通常スコットと関連すると思わbinwdith推定値は、彼の1979年論文の1である[1]() -などを見るウィキペディアを -少しダウンスクロール-またはRのをnclass.scott
。]
コードが「スコット推定値」と呼ぶものの1.059は、Silvermanによる(以前の)本にあります(リンクのSilverman参照のp45を参照してください。Scottの派生は、参照する本のp130-131にあります)。これは、正常理論の推定に基づいています。
以前に提案した理由と同様の理由で、Silvermanは1.059の削減を提案し続けています(実際、彼は本の中でScottが行っているように、実際には1.059ではなく1.06を使用しています)。彼は、通常でIMSEの効率が10%を超えないように値を減らした値を選択します。これは0.9の元です。
したがって、これらの両方のビン幅は、正常時のIMSE最適ビン幅に基づいており、1つは最適値で、もう1つは(約15%小さく、通常の最適値の効率の90%以内に収まります)。[私はそれらの両方を「シルバーマン」の見積もりと呼びます。スコットに1.059という名前を付けた理由がわかりません。]
私の意見では、両方とも大きすぎます。IMSEに最適な密度の推定値を取得するためにヒストグラムを使用しません。それ(IMSEの意味で最適な密度の推定値を取得する)が私がやりたいことだった場合、その目的のためにヒストグラムを使用したくありません。
ヒストグラムはノイズの多い側で誤っている必要があります(目で必要な平滑化を行います)。私は、これらの種類の規則が与えるデフォルトのビンの数をほぼ2倍(またはそれ以上)にします。したがって、1.06や0.9は使用せず、0.5程度の値を使用する傾向がありますが、サンプルサイズが非常に大きい場合はそれよりも少なくなります。
それらの両方を選択することは、ほとんどありません。どちらも、データで何が起こっているのかを見つけるのに使用するにはビンが少なすぎるためです(少なくとも小さなサンプルサイズで、ここを参照してください)。
[1]:スコット、DW(1979)、 "最適とに関するデータに基づくヒストグラム、" Biometrika、66、605-610。