タグ付けされた質問 「networks」

グラフ理論の一部としてネットワーク理論を指します。ニューラルネットワークに関する質問については、[neural-networks]タグを使用してください。

8
既存の変数と定義された相関関係を持つランダム変数を生成します
シミュレーション研究のために、既存の変数に対する事前定義された(母集団)相関を示すランダム変数を生成する必要があります。YYY 私は、に見えたRパッケージcopulaとCDVine特定の依存構造を持つランダムな多変量分布を生成することができました。ただし、結果の変数の1つを既存の変数に修正することはできません。 アイデアや既存の機能へのリンクを歓迎します! 結論: さまざまなソリューションで、2つの有効な答えが出ました。 カラカルによるR スクリプト。事前定義された変数との正確な(サンプル)相関を持つランダム変数を計算します 事前定義された変数に対する定義された母集団相関を持つランダム変数を計算するR 関数 [@ttnphnsの追加:質問のタイトルを単一の固定変数の場合から任意の数の固定変数に拡大するために自由を取りました。すなわち、いくつかの固定された既存の変数と事前定義された相関を持つ変数を生成する方法]

8
重み付けされたソーシャルネットワーク/グラフでコミュニティを検出する方法
重みのある無向のエッジを持つグラフでコミュニティ検出/グラフ分割/クラスタリングを実行することに関して、誰かが良い出発点を提案できるかどうか疑問に思っています。問題のグラフには約300万のエッジがあり、各エッジは接続する2つの頂点間の類似度を表します。特に、このデータセットでは、エッジは個人であり、頂点は観測された動作の類似性の尺度です。 過去に私はstats.stackexchange.comでここに着いた提案に従い、Newmanのモジュール性クラスタリングのigraphの実装を使用し、結果に満足しましたが、それは重みのないデータセットにありました。 私が見るべき特定のアルゴリズムはありますか?

4
対数正規分布とべき法則分布の違いの解釈(ネットワーク次数分布)
まず、私は統計学者ではありません。しかし、私は博士号の統計ネットワーク分析を行っています。 ネットワーク分析の一環として、ネットワーク度の相補累積分布関数(CCDF)をプロットしました。私が見つけたのは、従来のネットワーク分布(WWWなど)とは異なり、分布は対数正規分布に最も適しているということです。私はそれをべき法則に適合させようとしましたが、Clauset et alのMatlabスクリプトを使用して、曲線の尾部がカットオフのあるべき法則に従うことがわかりました。 点線はべき乗則を表します。紫色の線は、対数正規フィットを表します。緑の線は指数近似を表します。 私が理解するのに苦労しているのは、これがすべて意味するものですか?このトピックについて少し触れているNewmanのこの論文を読んだことがあります:http : //arxiv.org/abs/cond-mat/0412004 以下に私の推測を示します。 次数の分布がべき法則の分布に従う場合、リンクとネットワークの次数の分布に線形の優先的アタッチメントがあることを理解します(豊かになるほど豊かな効果またはユールプロセス)。 私が目撃している対数正規分布では、曲線の始まりに準線形の優先的付着があり、べき乗則によって適合することができる尾部に向かってより線形になると言うのは正しいですか? また、対数正規分布は確率変数の対数(Xなど)が正規分布しているときに発生するため、対数正規分布ではXの値が小さく、Xの値が小さいべき法則分布に従うランダム変数は さらに重要なことは、ネットワーク度の分布に関して、対数正規の優先添付ファイルはまだスケールフリーネットワークを示唆していますか?私の本能は、曲線の尾部がべき法則で適合できるため、ネットワークはスケールフリー特性を示すと結論付けることができることを教えてくれます。

4
エッジケースの精度と再現率の正しい値は何ですか?
精度は次のように定義されます: p = true positives / (true positives + false positives) それは、それを修正しているtrue positivesとfalse positives、精度が1に近づくアプローチ0? リコールに関する同じ質問: r = true positives / (true positives + false negatives) 現在、これらの値を計算する必要がある統計テストを実装していますが、分母が0である場合があり、この場合にどの値を返すのか迷っています。 PS:不適切なタグをすみません、、およびを使用したいのですがrecall、新しいタグをまだ作成できません。precisionlimit
20 precision-recall  data-visualization  logarithm  references  r  networks  data-visualization  standard-deviation  probability  binomial  negative-binomial  r  categorical-data  aggregation  plyr  survival  python  regression  r  t-test  bayesian  logistic  data-transformation  confidence-interval  t-test  interpretation  distributions  data-visualization  pca  genetics  r  finance  maximum  probability  standard-deviation  probability  r  information-theory  references  computational-statistics  computing  references  engineering-statistics  t-test  hypothesis-testing  independence  definition  r  censoring  negative-binomial  poisson-distribution  variance  mixed-model  correlation  intraclass-correlation  aggregation  interpretation  effect-size  hypothesis-testing  goodness-of-fit  normality-assumption  small-sample  distributions  regression  normality-assumption  t-test  anova  confidence-interval  z-statistic  finance  hypothesis-testing  mean  model-selection  information-geometry  bayesian  frequentist  terminology  type-i-and-ii-errors  cross-validation  smoothing  splines  data-transformation  normality-assumption  variance-stabilizing  r  spss  stata  python  correlation  logistic  logit  link-function  regression  predictor  pca  factor-analysis  r  bayesian  maximum-likelihood  mcmc  conditional-probability  statistical-significance  chi-squared  proportion  estimation  error  shrinkage  application  steins-phenomenon 

2
接続数を負にできない場合、どうすれば接続数をガウスにできますか?
私は(仮想ではなく)ソーシャルネットワークを分析しており、人々のつながりを観察しています。人がランダムに接続する別の人を選択する場合、人のグループ内の接続の数は、少なくとも現在読んでいる本によると、正常に分散されます。 分布がガウス(正規)であることをどのように知ることができますか?ポアソン、ライス、レイリーなどの他の分布があります。理論上のガウス分布の問題は、値がから(確率はゼロになりますが)、接続数は負。−∞−∞-\infty+∞+∞+\infty 各人が独立して(ランダムに)接続する別の人をピックアップした場合にどの分布が期待できるかを知っていますか?

2
相互作用モデルで最適な機能を見つける
タンパク質のリストとその特徴値があります。サンプル表は次のようになります。 ...............Feature1...Feature2...Feature3...Feature4 Protein1 Protein2 Protein3 Protein4 行はタンパク質であり、列は機能です。 また、相互作用するタンパク質のリストもあります。例えば Protein3, Protein4 Protein1, Protein2 Protein4, Protein1 問題:予備的な分析のために、どの機能がタンパク質相互作用に最も寄与するかを知りたい。 私の理解では、通常、決定木はエントロピーに基づいて最も重要な機能を取得するために使用できますが、タンパク質ペア(つまり、相互作用)に拡張する方法はわかりません。そのような目的のための方法はありますか?

3
ニューマンのネットワークモジュール性は、署名された重み付きグラフで機能しますか?
グラフのモジュール性は、ウィキペディアのページで定義されています。異なるポスト、誰かが隣接行列ので、そのモジュールを容易に重み付けネットワークについて計算(および最大化)することができる説明同様に価値の関係を含むことができます。ただし、これが、たとえば-10〜+10の範囲の符号付きの値付きエッジでも機能するかどうかを知りたいのですが。この問題について、直感、証明、または参照を提供できますか?AijAijA_{ij}

2
現実のネットワーク/グラフのすべてのエッジが統計的に偶然に発生する可能性が高いとはどういう意味ですか?
このホワイトペーパーで概説されているバックボーンネットワーク抽出方法を使用しています。http://www.pnas.org/content/106/16/6483.abstract 基本的に、著者は、グラフの各エッジに対して、エッジが偶然に起こった可能性がある確率を生成する統計に基づく方法を提案します。典型的な統計的有意性カットオフ0.05を使用しています。 私はこの方法をいくつかの現実のネットワークに適用してきましたが、興味深いことに、一部のネットワークはエッジがそれほど重要ではなくなります。これがネットワークに何を伴うかを理解しようとしています。この方法をネットワークに適用したがエッジがまったくなかったのは、生成したランダムなネットワークにこの方法を適用したときだけでした。これはまさに期待通りの結果でした。 実社会のネットワークの例として、エコノミストが過去25年間に米国上院の二極化を示した最近のネットワークの視覚化を見たことがあります:http : //www.economist.com/news/united-states/21591190 -united-states-amoeba。これらのネットワークにバックボーンネットワーク抽出方法を適用しましたが、重要なエッジはありませんでした。生のエッジは明らかに優先的な接続とクラスタリングを示していますが、これは偶然ですか?上院の投票ネットワークは本質的にランダムですか?

2
ネットワーク(グラフ)が「小さな世界」のネットワークであるかどうかを統計的にテストするにはどうすればよいですか?
スモールワールド・ネットワークは、ほとんどのノードが互いに隣国ではありませんが、ほとんどのノードは、ホップまたは少ない工程数で、他のすべてのから到達することができる数学的なグラフの種類です。具体的には、スモールワールドネットワークは、ランダムに選択された2つのノード間の距離L(必要なステップ数)がネットワーク内のノード数Nの対数に比例して増加するネットワークとして定義されます。 L ≈ ログ(N)L≈log⁡(N) L \approx \log(N) LとNの間のこの関係は「経験則」です。私の研究では、小さな世界のグラフをより専門的に決定したいと思っています。自分のグラフが小さな世界のグラフであるかどうかをどのようにテストできますか? スモール・ワールド現象は、スタンレー・ミルグラムと米国の人々の社会的ネットワークの平均経路長を調べる他の研究者が行ったいくつかの実験を構成しました。この研究は、人間の社会が短い経路長を特徴とする小さな世界タイプのネットワークであることを示唆しているという点で画期的でした。ミルグラムは自分でこの用語を使用していませんが、実験はしばしば「6つの分離度」というフレーズに関連付けられています。 前もって感謝します。

7
Rを使用して400万のエッジネットワークの中心性測定を計算する方法
私は、互いに通信する人々を表す有向ネットワークの400万エッジのCSVファイルを持っています(たとえば、ジョンはメアリーにメッセージを送信し、メアリーはアンにメッセージを送信し、ジョンはメアリーに別のメッセージを送信します)。私は2つのことをしたいと思います: 各個人の次数、(おそらく)固有ベクトル中心性測度の次数を求めます。 ネットワークの視覚化を取得します。 私のラップトップには電力があまりないので、Linuxサーバーのコマンドラインでこれを実行したいと思います。そのサーバーとstatnetライブラリにRをインストールしました。私が見つかりました。この2009年のポスト私は同じことをやろうとしていると、それで問題が発生したよりも多くの有能な誰かのを。だから私は他の誰かがこれを行う方法についてのポインタを持っているのではないかと思っていました。 ちょうどあなたにアイデアを与えるために、これは私のCSVファイルがどのように見えるかです: $ head comments.csv "src","dest" "6493","139" "406705","369798" $ wc -l comments.csv 4210369 comments.csv

4
負の重みを考慮するグラフクラスタリングアルゴリズム
私は、グラフの値は、範囲[-1,1]であることができる重み付け有向エッジとインスタンス。頂点がより相関しているグループを見つけるために、このグラフでクラスタリングを行う必要があります。 複数のクラスタリングまたはコミュニティ検出グラフベースのアルゴリズムを検索しましたが、負の重みのためにそれらのほとんどが機能しません。これまで、私はスピングラス(igraphライブラリではいわゆるポッツモデルに基づくアルゴリズムです)アルゴリズムを適用しており、正と負の両方の重みで機能するようです。 負および正のエッジの重みを持つグラフでクラスタリングまたはコミュニティ検出を行うための他のアルゴリズムはありますか? 更新:エッジの重みは相関を表し、1は2つの頂点が強く相関していることを意味し、-1は逆相関し、0は独立していることを意味します。

4
グループ間の接続の視覚化
私は(企業の)約10のグループを持っています。各グループは相互に接続されています。私が持っているデータは、つながりの強さを表しています。グループAの誰かがグループBにメールを送信した回数を想像してください。 接続の強度は0にすることができます。2つのグループABとBAの間には2つの接続があります。 a)これを視覚化する良い方法は何でしょうか?たとえば、各グループが円であると想像できます。線は円を接続し、線の太さは接続の強さを表します。グループのサイズを示すことができればプラスになりますが、必須ではありません。 b)これを視覚化するためのソフトウェアツールを知っていますか?このツールは高すぎるものであってはならず、試用版として入手可能であるべきです。今のところ、これは単なる概念実証に過ぎません。Webベースである必要はありません。

3
友達のネットワークを考えると、最も「中央」の友達を検出できますか?
Facebookから友達のリストをダウンロードできるとすれば、どの友達がお互いの友達なのかを知ることができます。この情報から、どの友達が「中央」であるかを推定できますか?(私はこの文脈で「中心」が何であるかを定義する方法を正確に確信していません) どのような情報/仮定が必要ですか? ありがとう。
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.