この離散分布には名前がありますか?


21

この離散分布には名前がありますか?以下のためのi1...N

f(i)=1Nj=iN1j

この分布に出くわしたのは次のとおりです。ユーティリティ機能によってランク付けされたアイテムのリストがあります。リストの先頭にバイアスをかけながら、アイテムの1つをランダムに選択します。そこで、最初に1とNの間のインデックスjを一様に選択します。次に、インデックス1とjの間のアイテムを選択します。このプロセスにより上記の分布が得られると思います。NjNj


2
これは分布ではなく、正規化されていません。
whuber

@whuber最初はそう思っていました(そして、誤解してコメントを削除したことに気付く前にコメントしました)が、定義を誤解していたことがわかりました。さらに誤解がない限り、正規化された確率質量関数です。
Glen_b-モニカの復職

4
正規化されています。1/1は合計に一度だけ表示されます(f(1)になります)。1/2は正確に2回表示されます(f(1)およびf(2)にあります)。など。したがって、これらの合計の合計はNになり、正規化定数は1 / Nとして表示されます。チェックアウトします。
rcorty

1
しかし、さらに言えば、このディストリビューションが何と呼ばれているのかわかりません。また、あなたが説明したプロセスがこのディストリビューションにどのようにつながるかはわかりません。私が考えていたのは、それがスティックを破るプロセスの離散バージョンのように聞こえるということです。これは非常にグーグルです。
rcorty

@Glen_bありがとう。私はこれを電話で読んでいたが、十分にはっきりと表示しなかった。f
whuber

回答:


30

あなたは、支持体である分布である負の対数分布の離散化バージョンを有する、そのPDFであるF T = - ログTを[0,1]f(t)=logt

これを確認するために、私はセット内の値を取るためにあなたの確率変数を再定義するつもりですではなく{ 0 1 2 ... N }{0,1/N,2/N,,1}{0,1,2,,N}と呼んで分配得。そして、私の主張はT

Pr(T=tN)1Nlog(tN)

しばらくトンN,tは(ほぼ)一定に保持されます。 tN

最初に、この収束を示す小さなシミュレーション実験。ディストリビューションのサンプラーの小さな実装を次に示します。

t_sample <- function(N, size) {
  bounds <- sample(1:N, size=size, replace=TRUE)
  samples <- sapply(bounds, function(t) {sample(1:t, size=1)})
  samples / N
}

分布から取得した大きなサンプルのヒストグラムは次のとおりです。

ss <- t_sample(100, 200000)
hist(ss, freq=FALSE, breaks=50)

ここに画像の説明を入力してください

これが対数のpdfオーバーレイです:

linsp <- 1:100 / 100
lines(linsp, -log(linsp))

ここに画像の説明を入力してください

この収束が発生する理由を確認するには、式から始めます

Pr(T=tN)=1Nj=tN1j

Nで乗算および除算N

Pr(T=tN)=1Nj=tNNj1N

合計は、関数リーマン合計になりました。g(x)=1xtN1N場合、

Pr(T=tN)1NtN11xdx=1Nlog(tN)

それは私が到達したかった表現です。


どういたしまして。これは素晴らしい質問であり、私はそれを解決するのがとても楽しかった。
マシュードゥルーリー

6

これは、ホイットワース分布に関連しているようです。(私が正しいことを覚えていれば、それは一連の順序付けられた値の分布であるため、それはホイットワース分布であるとは思わないが、それはそれに接続されているようであり、同じ合計スキームに依存している。)

ホイットワース(および多数の参考文献)については、

アンソニー・ローランスとロバート・マークス(2008)
「リソースに制約のある業界の企業規模分布」、
Applied Economics、vol。40、問題12、1595-1607ページ

ここにワーキングペーパーのバージョンがあるようです

こちらもご覧ください

ナンシー・L・ゲラー、(1979)
ホイットワース分布の重要性のテスト
、米国情報学会誌、Vol.30(4)、pp.229-231


2
この答えを自己完結させるために、ホイットワース分布の定義を提供し、おそらくあなたが見る接続に関する説明のいくつかの単語を提供できますか?
whuber

@whuberはい、それは現状のままのコメントでなければなりません。詳細を編集しますが、かなり長くなります。
Glen_b-モニカの復職

ある種の定義で十分です。
whuber

ありがとう、それは理解されましたが、それでも結果になります。
Glen_b
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.