ランダムグラフの三角形の数の分布と分散


10

Erdos-Renyiランダムグラフ考えます。個の頂点のセットは、ラベル付けされます。エッジのセットは、ランダムプロセスによって作成されます。N V V = { 1 2 ... N } EG=(V(n),E(p))nVV={1,2,,n}E

ましょう確率であり、各非順序対頂点()内のエッジとして生じる確率で独立他の対の、。0 < p < 1 { i j } i j E pp0<p<1{i,j}ijEp

の三角形は、、、がエッジであるような、異なる頂点の順序付けされていないトリプルです。。{ i j k } { i j } { j k } { k i } GG{i,j,k}{i,j}{j,k}{k,i}G

可能な三角形の最大数は(n3)です。確率変数XをグラフG内の観測された三角形の数と定義しますG

3つのリンクが同時に存在する確率はp3です。したがって、Xの期待値はE(X)= \ binom {n} {3} p ^ 3でX与えられます。単純に、分散はE(X ^ 2)= \ binom {n} {3} p ^ 3(1-p ^ 3)によって与えられると推測できますが、そうではありません。E(X)=(n3)p3E(X2)=(n3)p3(1p3)

次のMathematicaコードは問題をシミュレートします:

n=50;
p=0.6;
t=100;
myCounts=Table[Length[FindCycle[RandomGraph[BernoulliGraphDistribution[n,p]],3,All]],{tt,1,t}];
N[Mean[myCounts]] // 4216. > similar to expected mean
Binomial[n,3]p^3 // 4233.6
N[StandardDeviation[myCounts]] // 262.078 > not similar to "expected" std
Sqrt[Binomial[n,3](p^3)(1-p^3)] // 57.612
Histogram[myCounts]

Xの分散とは何Xですか?

回答:


4

ましょう IFF三角形を形成します。次に、および各です。これは、期待値の計算に使用したものです。Yijk=1{i,j,k}X=i,j,kYijkYijkBernoulli(p3)

分散の問題は、が独立していないことです。実際、と書き を計算する必要があります。これは、両方の三角形が存在する確率です。いくつかのケースがあります:Yijk

X2=i,j,ki,j,kYijkYijk.
E[YijkYijk]
  • もし(同じ3つの頂点)を。二重和にはそのような項がます。{i,j,k}={i,j,k}E[YijkYijk]=p3(n3)
  • セットとに共通の要素が2つある場合、2つの三角形を取得するために5つのエッジが存在する必要があるため、。そのような用語は合計でになります。{i,j,k}{i,j,k}E[YijkYijk]=p512(n4)
  • セットとに共通の1つの要素がある場合、6つのエッジが存在する必要があるため、。そのような用語は合計でになります。{i,j,k}{i,j,k}E[YijkYijk]=p630(n5)
  • セットとに共通の0要素がある場合、6つのエッジが存在する必要があるため、。合計でになります。{i,j,k}{i,j,k}E[YijkYijk]=p620(n6)

すべてのケースをカバーしたことを確認するには、合計がことに注意してください。(n3)2

(n3)+12(n4)+30(n5)+20(n6)=(n3)2

期待される平均値の2乗を引くことを忘れないでください。これをすべてまとめると、次のようになります。

E[X2]E[X]2=(n3)p3+12(n4)p5+30(n5)p6+20(n6)p6(n3)2p6

次のRコードは、例と同じ数値を使用して標準偏差を計算します。これは、シミュレーションの262の値にかなり近い値です。

n=50
p=0.6
sqrt(choose(n, 3)*p^3+choose(n, 2)*(n-2)*(n-3)*p^5+(choose(n, 3)*choose(n-3, 3)+n*choose(n-1, 2)*choose(n-3, 2))*p^6-4233.6^2)
298.7945

次のMathematicaコードも標準偏差を計算しますが、同じ結果になります。

mySTD[n_,p_]:=Sqrt[Binomial[n,3]p^3+12Binomial[n,4]p^5+30 Binomial[n,5]p^6+20Binomial[n,6]p^6-(Binomial[n,3]p^3)^2]
mySTD[50,0.6] // gives 298.795

2
実際にはかなり簡単です。よくやった!答えを少し更新し、式を簡略化してMathematicaコードを追加しました。また、シミュレーションを10k回実行し、期待値に非常に近い295.37のstdを取得しました。
LBogaardt

1
編集ありがとうございます。10,000回の反復によるシミュレーションで答えが確認できてうれしいです。
ロビンライダー

有向グラフの元の参照を見つけました:Holland(1970)。ソシオメトリックデータの構造を検出する方法。
LBogaardt

0

を導出するための少し異なるアプローチを提供します。X2

ロビン・ライダーがしたのと同じケースの区別で:

  • 場合すなわち3つの頂点が同じであり、したがって、私たちは、3つの頂点を選択しなければならないn個の可能な。存在する3つのエッジが必要 です。結合:{i,j,k}={i,j,k}(n3)p3(n3)p3

  • もしと手段は、その共通に2つの頂点を有するれるおよびその逆(各三角形には、他の三角形の一部ではない1つの頂点があります)。Wlogがとが前述の分離した頂点であり、 =、 =と想像してください。 =、 =を実現するには、n個の可能なから同じ2つの頂点を選択する必要があります。以下のための{i,j,k}{i,j,k}v{i,j,k}v{i,j,k}v=kv=kiijjiijj(n2)kk残っている頂点からさらに2つを選択する必要があります。最初のもの:そして2番目のもの:。エッジとは同じであるため、5つのエッジが存在する必要があります。結合:(n2)(n3){i,j}{i,j}p5(n2)(n2)(n3)p5

  • もしと一般的にただ一つの頂点を有し、その後4は論理和です。wlogを想像してみてください =です。つまり、n個の可能な頂点の中から、1選択する必要があります。三角形の場合、残りのから2つの頂点を選択します。三角形の場合、残りのから。これは、および。共通の頂点が1つしかないため、6つのエッジが存在する必要があります{i,j,k}{i,j,k}iin{i,j,k}(n1)(n12){i,j,k}(n3)(n32)j{i,j,k}k{i,j,k}p6。組み合わせ:n(n12)(n32)p6

  • 最後のケースの場合:とに共通の頂点がない場合、2つの三角形は分離します。最初の三角形、n個の可能なから3つの頂点を選択します。そして、2番目の三角形、残りの個のうち3つの頂点。三角形は分離している、つまりエッジと頂点を共有していないため、6つのエッジが存在する必要があります。結合:{i,j,k}{i,j,k}(n3)(n3)(n33)p6(n3)(n33)p6

ロビンライダーのアプローチと同様に、次のことも確認できます。

(n3)+(n2)(n2)(n3)+n(n12)(n32)+(n3)(n33)=(n3)2が成り立つ。

これはにつながります:

Var[X]=E[X2]E[X]2=(n3)p3+(n2)(n2)(n3)p5+n(n12)(n32)p6+(n3)(n33)p6(n3)2p6.

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.