タグ付けされた質問 「graph-theory」

グラフは、オブジェクトとそれらの相互関係の抽象的な表現であり、オブジェクトは「ノード」であり、オブジェクト間の接続は「エッジ」です。

4
グラフィカルモデルのグラフ理論はどこにありますか?
グラフィカルモデルの紹介では、それらを「...グラフ理論と確率理論の融合」と説明しています。 確率理論の部分はわかりますが、グラフ理論が正確に当てはまる場所を理解するのは困難です。グラフ理論からの洞察は、不確実性の下での確率分布と意思決定の理解を深めるのに役立ちましたか? PGMを「ツリー」、「二部」、「無向」などに分類するなど、PGMでのグラフ理論用語の明白な使用を超えて、具体的な例を探しています。

6
グラフ理論—分析と可視化
被験者がCrossValidatedの利益を得るかどうかはわかりません。教えてくれます。 私は(グラフ理論から)グラフを研究する必要があります。特定の数のドットが接続されています。すべてのドットと各ドットが依存しているドットを含むテーブルがあります。(私も含意を持つ別のテーブルを持っています) 私の質問は次のとおり です。それを簡単に研究するための優れたソフトウェア(またはRパッケージ)はありますか? グラフを表示する簡単な方法はありますか?


1
バックドアとフロントドアの調整による因果関係
以下の因果関係グラフでに対するの因果関係の影響を計算する場合は、バックドア調整とフロントドア調整の定理の両方を使用できます。つまり、 Y P (y | do(X = x ))= ∑ u P (y | x 、u )P (u )バツXXYYYP(y| する(X= x ))= ∑あなたP(y| x、u)P(u )P(y|do(X=x))=∑uP(y|x,u)P(u)P(y | \textit{do}(X = x)) = \sum_u P(y | x, u) P(u) そして P(y| する(X= x ))= ∑zP(z| x) ∑バツ』P(y| バツ』、z)P(x』)。P(y|do(X=x))=∑zP(z|x)∑x′P(y|x′,z)P(x′).P(y | \textit{do}(X = x)) = …

2
現実のネットワーク/グラフのすべてのエッジが統計的に偶然に発生する可能性が高いとはどういう意味ですか?
このホワイトペーパーで概説されているバックボーンネットワーク抽出方法を使用しています。http://www.pnas.org/content/106/16/6483.abstract 基本的に、著者は、グラフの各エッジに対して、エッジが偶然に起こった可能性がある確率を生成する統計に基づく方法を提案します。典型的な統計的有意性カットオフ0.05を使用しています。 私はこの方法をいくつかの現実のネットワークに適用してきましたが、興味深いことに、一部のネットワークはエッジがそれほど重要ではなくなります。これがネットワークに何を伴うかを理解しようとしています。この方法をネットワークに適用したがエッジがまったくなかったのは、生成したランダムなネットワークにこの方法を適用したときだけでした。これはまさに期待通りの結果でした。 実社会のネットワークの例として、エコノミストが過去25年間に米国上院の二極化を示した最近のネットワークの視覚化を見たことがあります:http : //www.economist.com/news/united-states/21591190 -united-states-amoeba。これらのネットワークにバックボーンネットワーク抽出方法を適用しましたが、重要なエッジはありませんでした。生のエッジは明らかに優先的な接続とクラスタリングを示していますが、これは偶然ですか?上院の投票ネットワークは本質的にランダムですか?

2
ランダムグラフの三角形の数の分布と分散
Erdos-Renyiランダムグラフ考えます。個の頂点のセットは、ラベル付けされます。エッジのセットは、ランダムプロセスによって作成されます。N V V = { 1 、2 、... 、N } EG=(V(n),E(p))G=(V(n),E(p))G=(V(n),E(p))nnnVVVV={1,2,…,n}V={1,2,…,n}V = \{1,2,\ldots,n\}EEE ましょう確率であり、各非順序対頂点()内のエッジとして生じる確率で独立他の対の、。0 &lt; p &lt; 1 { i 、j } i ≠ j E pppp0&lt;p&lt;10&lt;p&lt;10<p<1{i,j}{i,j}\{i,j\}i≠ji≠ji \neq jEEEppp の三角形は、、、がエッジであるような、異なる頂点の順序付けされていないトリプルです。。{ i 、j 、k } { i 、j } { j 、k } { k 、i } GGGG{i,j,k}{i,j,k}\{i,j,k\}{i,j}{i,j}\{i,j\}{j,k}{j,k}\{j,k\}{k,i}{k,i}\{k,i\}GGG 可能な三角形の最大数は(n3)(n3)\binom{n}{3}です。確率変数XXXをグラフG内の観測された三角形の数と定義しますGGG。 3つのリンクが同時に存在する確率はp3p3p^3です。したがって、Xの期待値はE(X)= \ …

2
ネットワーク(グラフ)が「小さな世界」のネットワークであるかどうかを統計的にテストするにはどうすればよいですか?
スモールワールド・ネットワークは、ほとんどのノードが互いに隣国ではありませんが、ほとんどのノードは、ホップまたは少ない工程数で、他のすべてのから到達することができる数学的なグラフの種類です。具体的には、スモールワールドネットワークは、ランダムに選択された2つのノード間の距離L(必要なステップ数)がネットワーク内のノード数Nの対数に比例して増加するネットワークとして定義されます。 L ≈ ログ(N)L≈log⁡(N) L \approx \log(N) LとNの間のこの関係は「経験則」です。私の研究では、小さな世界のグラフをより専門的に決定したいと思っています。自分のグラフが小さな世界のグラフであるかどうかをどのようにテストできますか? スモール・ワールド現象は、スタンレー・ミルグラムと米国の人々の社会的ネットワークの平均経路長を調べる他の研究者が行ったいくつかの実験を構成しました。この研究は、人間の社会が短い経路長を特徴とする小さな世界タイプのネットワークであることを示唆しているという点で画期的でした。ミルグラムは自分でこの用語を使用していませんが、実験はしばしば「6つの分離度」というフレーズに関連付けられています。 前もって感謝します。

1
グラフカーネルSVMハイパーパラメーターを調整する方法は何ですか?
グラフ存在するデータがあります。頂点はの2つのクラスのいずれかに属しており、2つのクラスを区別するようにSVMをトレーニングすることに興味があります。このための一つの適切なカーネルは、拡散カーネル、あるラプラシアンの及びチューニングパラメータです。G = (V、E)G=(V、E)G=(V,E)y私∈ { - 1 、1 }y私∈{−1、1}y_i\in\{-1,1\}K= exp(- βL )、K=exp⁡(−βL)、K=\exp(-\beta L),LLLGGGββ\beta SVMを調整するにはハイパーパラメーターを選択する必要があるため、を調整する必要があり通常、この問題には交差検証を使用しますが、から頂点を省略するとグラフ全体が変更され、場合によっては接続されているコンポーネントの数も増えるため、これは適切ではないようです。接続されているコンポーネントの数が変化すると、一部の頂点が他の頂点から到達できなくなり、当初とは非常に異なるデータセットに直面します。つまり、削除された頂点が欠落しているだけでなく、その頂点に隣接していたグラフ内の他のすべての頂点に関する情報も欠落しています。θ = (β、C)。θ=(β、C)。\theta=(\beta, C).私私iGGG私私ijjj 交差検証の基本的な概念は、新しいデータが表示されたときのモデルのパフォーマンスを概算したいというものです。標準的な問題では、テスト用のデータの一部を省略しても、残りのトレーニングデータの値は変わりません。ただし、グラフデータの場合、モデルがCV設定で「新しい」データを表示することの意味が明確ではありません。頂点またはエッジを省略すると、データが完全に変更される可能性があります。たとえば、スターグラフであるグラフを想像してください。1つの頂点には頂点から個の頂点があり、他のすべての頂点には1個のエッジがあります。中央の頂点を省略してトレーニングデータS= (VS、ES)S=(VS、ES)S=(V_S,E_S)kkkkkkkkkS∗S∗S^*グラフが完全に切断され、カーネル行列は対角になります!しかし、もちろん、提供されるこのトレーニングデータでモデルをトレーニングすることは可能です。あまり明確でないのは、結果のモデルのサンプル外のパフォーマンスをテストすることの意味です。のカーネルマトリックスを再計算し、それを予測のために提供しますか?S∗S∗S^*SSS または、代わりに、のカーネルマトリックス全体を計算し、必要に応じて行と列を省略してSVMの推定に使用されるカーネルマトリックスを生成することから始めますか?中央ノードを含めることは、すべての頂点が他のすべての頂点から到達可能であり、カーネルマトリックスが密であることを意味するため、これには独自の概念上の問題があります。この包含は、フォールド全体に情報漏えいがあり、交差検証出力にバイアスをかけることを意味しますか?一方で、省略された中央ノードはグラフを接続するため、省略された中央ノードに関するデータはまだ存在しています。一方、ラベルについては何も知りません。SSSSSS yyy このようにCVを実行することで、サンプルからの推定値がかなり偏りのないものになっていることを確認できます。 このタイプの問題のハイパーパラメータをどのように選択しますか?CVは不完全ですが許容できますか、それとも特別な方法が必要ですか?私のコンテキストではハイパーパラメータの調整はまったく可能ですか?

1
無限ランダム幾何学グラフでランダムウォークを行うロボットの密度
ノードの位置が密度ポアソン点プロセスに従い、エッジがdよりも近いノード間に配置されている無限ランダム幾何学グラフを考えてみます。したがって、エッジの長さは次のPDFに従います。ρρ\rhoddd f(l )= { 2 ld2L ≤ D0l &gt; df(l)={2ld2l≤d0l&gt;d f(l)= \begin{cases} \frac{2 l}{d^2} \;\quad l \le d \\ 0 \qquad\; l > d \end{cases} 上のグラフで、原点を中心とする半径の円の内側のノードを考えます。時間t = 0で、言及した各ノードの内側に小さなロボットを配置するとします。つまり、平面上のロボットの密度は次のように与えられます。rrrt = 0t=0t=0 ここで、lは原点からの距離です。次の図は、ロボットの初期配置の例を示しています。g(l )= { ρL ≤ R0l &gt; dg(l)={ρl≤r0l&gt;d g(l)= \begin{cases} \rho \quad l \le r \\ 0 \quad\; l > …

3
SVDを実行して欠損値を代入する方法、具体例
SVDを適用する前に欠損値を処理する方法に関する素晴らしいコメントを読みましたが、簡単な例でどのように機能するか知りたいです。 Movie1 Movie2 Movie3 User1 5 4 User2 2 5 5 User3 3 4 User4 1 5 User5 5 1 5 上記のマトリックスを考えると、NAの値を削除すると、User2とUser5しかなくなります。これは、私のUが2×kになることを意味します。しかし、欠損値を予測する場合、Uは5×kである必要があります。これは、特異値とVで乗算できます。 上記のマトリックスで、最初に欠損値のあるユーザーを削除してからSVDを適用して、欠損値を記入する人はいますか?数学記号を使いすぎずに、適用した手順の非常に簡単な説明を提供し、答えを実用的なものにしてください(つまり、数値に別の数値を掛けると答えが得られます)。 次のリンクを読みました。 stats.stackexchange.com/q/33142 stats.stackexchange.com/q/31096 stats.stackexchange.com/q/33103
8 r  missing-data  data-imputation  svd  sampling  matlab  mcmc  importance-sampling  predictive-models  prediction  algorithms  graphical-model  graph-theory  r  regression  regression-coefficients  r-squared  r  regression  modeling  confounding  residuals  fitting  glmm  zero-inflation  overdispersion  optimization  curve-fitting  regression  time-series  order-statistics  bayesian  prior  uninformative-prior  probability  discrete-data  kolmogorov-smirnov  r  data-visualization  histogram  dimensionality-reduction  classification  clustering  accuracy  semi-supervised  labeling  state-space-models  t-test  biostatistics  paired-comparisons  paired-data  bioinformatics  regression  logistic  multiple-regression  mixed-model  random-effects-model  neural-networks  error-propagation  numerical-integration  time-series  missing-data  data-imputation  probability  self-study  combinatorics  survival  cox-model  statistical-significance  wilcoxon-mann-whitney  hypothesis-testing  distributions  normal-distribution  variance  t-distribution  probability  simulation  random-walk  diffusion  hypothesis-testing  z-test  hypothesis-testing  data-transformation  lognormal  r  regression  agreement-statistics  classification  svm  mixed-model  non-independent  observational-study  goodness-of-fit  residuals  confirmatory-factor  neural-networks  deep-learning 

4
負の重みを考慮するグラフクラスタリングアルゴリズム
私は、グラフの値は、範囲[-1,1]であることができる重み付け有向エッジとインスタンス。頂点がより相関しているグループを見つけるために、このグラフでクラスタリングを行う必要があります。 複数のクラスタリングまたはコミュニティ検出グラフベースのアルゴリズムを検索しましたが、負の重みのためにそれらのほとんどが機能しません。これまで、私はスピングラス(igraphライブラリではいわゆるポッツモデルに基づくアルゴリズムです)アルゴリズムを適用しており、正と負の両方の重みで機能するようです。 負および正のエッジの重みを持つグラフでクラスタリングまたはコミュニティ検出を行うための他のアルゴリズムはありますか? 更新:エッジの重みは相関を表し、1は2つの頂点が強く相関していることを意味し、-1は逆相関し、0は独立していることを意味します。

3
移動履歴のみを使用してネットワーク上の次の移動を予測する統計モデル
過去の動きとグラフの構造のみに基づいて、グラフの次の動きを予測する統計モデルを構築することは可能ですか? 私は問題を説明するために例を作りました: 時間は離散的です。すべてのラウンドで、現在のノード/頂点に留まるか、接続されたノードの1つに移動します。時間は離散的であり、せいぜい1つのノードをラウンドごとに進めることができるため、速度はありません。 過去のルート/移動履歴:{A、B、C} -現在の位置:C 有効な次の手:C、B、X、Y、Z Cを選択した場合、固定されます。 場合Bあなたが後方に移動し、 そしてもしX、Y、またはZが前進を意味します。 リンクにもノードにも重みはありません。 最終的な宛先ノードはありません。観察された動きの動作の一部はランダムであり、一部には一定の規則性があります。 移動履歴を考慮しない非常に単純なモデルは、C、B、X、Y、およびZがそれぞれ次の移動になる確率が1/5 であると予測するだけです。 しかし、構造と運動履歴に基づいて、より良い統計モデルを作成することは可能だと思います。たとえば、前のラウンドでノードBから直接そこに移動した可能性があるため、インスタンスXの確率は低くなるはずです。同様に、Bも前のラウンドで固定されていた可能性があるため、確率が低くなります。 ユーザーがBに戻った場合、移動履歴は{A、B、C、B}のようになり、有効な移動はA、B、C、D、E、Xになります。Cへの移行は、固定されたままであった可能性があるため、確率が低くなるはずです。前のラウンドでCからXに移動できた可能性があるため、Xに移動する可能性も低くなります。以前の履歴も予測に影響を与える可能性がありますが、最近の履歴よりも重みを小さくする必要があります。2ラウンド前にBに滞在したか、A、D、E、Xに移動した可能性があります-3ラウンド前にAに滞在した可能性があります。 周りを見回すと、同様の問題が直面していることがわかりました。 移動体通信。オペレーターは、ユーザーが次に移動するセルタワーを予測して、通話/データ伝送をスムーズに引き継ぐことができるようにします。 ブラウザ/検索エンジンが次に進むページを予測しようとするWebナビゲーション。これにより、ページがプリロードおよびキャッシュされ、待機時間が短縮されます。同様に、マップアプリケーションは次に要求するマップタイルを予測し、これらをプリロードしようとします。 そしてもちろん運輸業界。
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.