時間的ネットワークでのリンク異常検出


32

リンク異常検出を使用してトレンドのトピックを予測するこの論文に出会いましたが、非常に興味深いことがわかりました。この論文は、「リンク異常検出によるソーシャルストリームの新興トピックの発見」です。

別のデータセットに複製したいのですが、それらの使用方法を知るための方法に十分な知識がありません。6か月の間にノードのネットワークの一連のスナップショットがあるとします。ノードには、次数の長い分布があり、ほとんどはわずかな接続しかありませんが、一部は非常に多くの接続を持ちます。この期間内に新しいノードが表示されます。

バーストの前兆と思われる異常なリンクを検出するために、論文で使用されている逐次割引正規化最尤計算をどのように実装できますか?より適切な他の方法はありますか?

理論的にも実際的にもお願いします。誰かがこれをPythonまたはRで実装する方法を教えてくれたら、それは非常に役立ちます。

誰でも?私はあなたが賢明な人々が答えのためのいくつかの最初の考えを持っていることを知っています、


1
R / pythonの設定を緩和してもかまわないのであれば、この私の作品が役に立つでしょうか? goo.gl/l7SLlB この方法の利点のいくつかは、あなたが機能、正規化とより多くのの種類を心配する必要はありませんということです。
アリエル14

1
質問を誤解しない限り、論文の著者がメソッドを実装したのと同じ方法で、論文からメソッドを実装できるはずです。方法が論文から再現できない場合は、著者に連絡する必要があります。作成者は、コードを提供することもできます。特定の理論的な質問やプログラミングの質問がある場合は、個別に質問する必要があります。
ナット

回答:


0

最初に、新しいノードの異常スコアの定義を考え出す必要があります(セクション3.1、3.2を参照)。幸いなことに、新しい投稿(その場合)と新しいノード(あなたの場合)の対応はほぼ1対1です。これは、ノード(投稿)であるノード(ユーザー)のセットのみに関心があるためです。関連する。

したがって、新しいノードを、それが持つエッジ/接続kの数と、接続されている他のノードのセットVで特徴付けることができます。したがって、式(1)〜(4)は同様の方法で記述できます。次に、新しいパラメータ導入した後、サブセクション3.1の最後に説明されているように、中華料理レストランプロセスを使用できます。γ。これで、確率(3)を取得したので、リンク異常スコア(7)を取得できます。

SDNMLが適用されるサブセクション3.4に記載されている手順を実行するのが難しい場合は、さらに質問してください。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.