この離散分布には名前がありますか?以下のための
この分布に出くわしたのは次のとおりです。ユーティリティ機能によってランク付けされたアイテムのリストがあります。リストの先頭にバイアスをかけながら、アイテムの1つをランダムに選択します。そこで、最初に1とNの間のインデックスjを一様に選択します。次に、インデックス1とjの間のアイテムを選択します。このプロセスにより上記の分布が得られると思います。
この離散分布には名前がありますか?以下のための
この分布に出くわしたのは次のとおりです。ユーティリティ機能によってランク付けされたアイテムのリストがあります。リストの先頭にバイアスをかけながら、アイテムの1つをランダムに選択します。そこで、最初に1とNの間のインデックスjを一様に選択します。次に、インデックス1とjの間のアイテムを選択します。このプロセスにより上記の分布が得られると思います。
回答:
あなたは、支持体である分布である負の対数分布の離散化バージョンを有する、そのPDFであるF (T )= - ログTを。
これを確認するために、私はセット内の値を取るためにあなたの確率変数を再定義するつもりですではなく{ 0 、1 、2 、... 、N }と呼んで分配得。そして、私の主張は
しばらくトンは(ほぼ)一定に保持されます。
最初に、この収束を示す小さなシミュレーション実験。ディストリビューションのサンプラーの小さな実装を次に示します。
t_sample <- function(N, size) {
bounds <- sample(1:N, size=size, replace=TRUE)
samples <- sapply(bounds, function(t) {sample(1:t, size=1)})
samples / N
}
分布から取得した大きなサンプルのヒストグラムは次のとおりです。
ss <- t_sample(100, 200000)
hist(ss, freq=FALSE, breaks=50)
これが対数のpdfオーバーレイです:
linsp <- 1:100 / 100
lines(linsp, -log(linsp))
この収束が発生する理由を確認するには、式から始めます
Nで乗算および除算
合計は、関数リーマン合計になりました。場合、
それは私が到達したかった表現です。
これは、ホイットワース分布に関連しているようです。(私が正しいことを覚えていれば、それは一連の順序付けられた値の分布であるため、それはホイットワース分布であるとは思わないが、それはそれに接続されているようであり、同じ合計スキームに依存している。)
ホイットワース(および多数の参考文献)については、
アンソニー・ローランスとロバート・マークス(2008)
「リソースに制約のある業界の企業規模分布」、
Applied Economics、vol。40、問題12、1595-1607ページ
こちらもご覧ください
ナンシー・L・ゲラー、(1979)
ホイットワース分布の重要性のテスト
、米国情報学会誌、Vol.30(4)、pp.229-231