接続数を負にできない場合、どうすれば接続数をガウスにできますか?


14

私は(仮想ではなく)ソーシャルネットワークを分析しており、人々のつながりを観察しています。人がランダムに接続する別の人を選択する場合、人のグループ内の接続の数は、少なくとも現在読んでいる本によると、正常に分散されます。

分布がガウス(正規)であることをどのように知ることができますか?ポアソン、ライス、レイリーなどの他の分布があります。理論上のガウス分布の問題は、値がから(確率はゼロになりますが)、接続数は負。+

各人が独立して(ランダムに)接続する別の人をピックアップした場合にどの分布が期待できるかを知っていますか?


1
明確化:「グループ全体の接続の総数」または「1人の接続の総数」に関する質問ですか?私の答えは暗黙的に後者を想定しています。

1
ライリー分布?それは私にとって新しいものです。参照またはリンクはありますか?
ワンストップ

3
「レイリー」?
whuber

回答:


6

人が人で、人による接続数がである場合、接続の合計数はです。ここでをランダム変数とすると、それらが独立しており、ますます多くの人がミックスに追加されるので、それらの分散は「あまりにも等しくない」と仮定し、リンデバーグ-レヴィ中央限界定理が適用されます。これは、標準化された合計の累積分布関数が正規分布の累積分布関数に収束すると断言します。つまり、合計のヒストグラムは、ni,1in,XiSn=i=1nXi/2Xin 大きくなります。

これが言っていないことを確認しましょう:

  • の分布が常に正確であると断言することはありません。あなたが指摘する理由のために、それはできません。Sn

  • 予想される接続数が収束することを意味するものではありません。実際、分岐する必要があります(無限に進みます)。標準化は、ディストリビューションの再センタリングと再スケーリングです。再スケーリングの量は無制限に増加しています。

  • が独立していないとき、またはnが大きくなるにつれて分散が大きく変化するときは何も言いません。(ただし、「わずかに」依存する一連の変数のCLTの一般化があります。)Xin


誰もが接続する相手を正確に1人選択するという質問を解釈していないことに注意してください。接続の数はランダムではなく決定されるため、不毛な理論になります。代わりに、ネットワークに入ったときに全員が他のn個の接続をランダムに選択し、合計で0からn個の接続で終わると述べると解釈しました。分散に仮定は、接続数に制限がある場合に任意の新人が行います保証さ数は、いくつかの「最小」ランダム性を持っていること。
whuber

とその分散について少し混乱しています。これは、人々に本質的な違いがあることを示唆していますか?Xi
アンディW

1
@Andyない人:接続の数。重要なことは、個人によって確立された接続の数が実際に変化し、一定に落ち着かない可能性が十分にあることです。その場合、(接続数の)制限分布は変化する初期接続の有限数によって決定されるため、正規分布に漸近的に近づくことはできません。
whuber

1

答えは、あなたがやろうとしている仮定に依存しています。ソーシャルネットワークは時間とともに絶えず進化しているため、静的なエンティティではありません。したがって、時間の経過とともにネットワークがどのように進化するかについて、いくつかの仮定を立てる必要があります。

n

Prob(No of connections for any individual=n1)=1

人がランダムに別の人を選択して接続すると、最終的には全員が接続されます。

ただし、実際のネットワークはこのように動作しません。人はいくつかの面で異なります。

  1. いつでも人のネットワークサイズは固定されており、別の接続が確立される確率は、その人のネットワークサイズの関数です(他の人を紹介するなど)。

  2. 人は、接続を形成する固有の傾向を持っています(一部は内向的/外向的など)。

これらの確率は時間やコンテキストなどで変化します。ネットワークの構造(ネットワークの密度、人々の行動など)について何らかの仮定をしない限り、簡単な答えがあるかどうかわかりません。


@Srikant「些細な答え」を導き出す方法を説明してもらえますか?(その背後にはいくつかの無言の仮定がなければなりません。)そして、「最終的に誰もがつながる」と結論付けるとき、あなたはどの定理を参照しますか?それはまったく明らかではありません!
whuber

@whuberネットワークサイズが固定されていると仮定しています。質問の状態:人が接続を確立するためにランダムに別の人を選ぶと、おそらくこれは進行中のプロセスです。したがって、時間が無限に近づくにつれて、誰もが接続されるべきです。定理はなく、直感だけです。おそらく、私は不正確な言語を使用しています。

@Srikant長い間、「Prob(No of connections = n)」がn = 3の場合1に等しく、それ以外の場合は常にゼロであるため、私はまだ混乱しています。結局のところ、「全員が接続される必要がある」場合、接続の数はn(n-1)/ 2に等しくなります。同時にいくつかの異なるランダムなプロセスを念頭に置いているかもしれません。それはあなたがしている仮定を明らかにし、もう少し正確になるのを助けるかもしれません。
whuber
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.