負の重みを考慮するグラフクラスタリングアルゴリズム


8

私は、グラフの値は、範囲[-1,1]であることができる重み付け有向エッジとインスタンス。頂点がより相関しているグループを見つけるために、このグラフでクラスタリングを行う必要があります。

複数のクラスタリングまたはコミュニティ検出グラフベースのアルゴリズムを検索しましたが、負の重みのためにそれらのほとんどが機能しません。これまで、私はスピングラス(igraphライブラリではいわゆるポッツモデルに基づくアルゴリズムです)アルゴリズムを適用しており、正と負の両方の重みで機能するようです。

負および正のエッジの重みを持つグラフでクラスタリングまたはコミュニティ検出を行うための他のアルゴリズムはありますか?

更新:エッジの重みは相関を表し、1は2つの頂点が強く相関していることを意味し、-1は逆相関し、0は独立していることを意味します。


重みは何を表していますか?
エリアサ

@eliasah私はそれを説明するために更新を行いました
Ewybe

別のスケールを使用してみましたか?これは、例の中間性中心性アルゴリズムに基づく通常のクラスタリング手法を使用する優れたソリューションとなる場合があります。
エリアサ、2015年

@eliasah相関の意味を保存することに興味があるので、これらのデータのスケーリングはそれほど簡単ではありません
Ewybe

1
クラスタリングの場合、相関の兆候は本当に必要ですか?逆相関もかなり強い関係です。以下の私の答えを参照してください。
QUITあり-Anony-Mousse 2015年

回答:


2

値を[0; 2]にマッピングしてみましたか?

次に、多くのアルゴリズムが機能します。

たとえば、ダイクストラを検討してください。負でないエッジの重みが必要ですaが、エッジの最小値がわかっている場合は、それを実行してx-a、最短のサイクルフリーパスを取得できます。

更新:相関値については、絶対値abs(x)(相関の強さです)に関心があるか、グラフを一時的に2つに分割することができます。最初に正の相関のみのクラスター、次に負の相関に兆候がクラスタリングにとってそれほど重要であり、以前のアプローチが機能しない場合のみ


それはどういうわけか私が提案したことであり、彼は「相関の意味を失う」と彼は言った。あれについてどう思う?
エリアサ、2015年

彼の更新された説明により、abs(x)はさらにうまく機能する可能性があります。
QUITあり-2015年

それにもかかわらず、[0,2]の方が代表的だと思います。加重グラフは通常、中心性、距離、直径などを計算するためにこれらの問題に非常に重要です
eliasah

1
だからといって後で差別できないということではありません。あなたが持ってしようとしたことを、結果はまだ有用であるかもしれませんか?
QUITあり-Anony-Mousse 2015年

1
次に、他のアプローチを試してください-正と負のクラスターを別々に見つけます。
QUITあり-Anony-Mousse 2015年

1

はい、負の重みで機能する「アフィニティ伝播」と呼ばれるアルゴリズムがあります。これはsklearnに実装されていると思います(こちらのドキュメントを参照)。舞台裏で起こっていることのリファレンスはここにあります

それがあなたが探しているものであることを願っています!


私はこのアルゴリズムを知りませんでした、それは良い解決策のようです。ぜひやってみます。ありがとうございました。
Ewybe、2015年

私の知る限り、アフィニティ伝播クラスタリングでは、正と負の相関を同時に考慮することはできませんが、それらを分離することはできません。その点では、その仕事は矛盾していると思います。
micans '19年

0

あなたが説明している問題は、相関クラスタリング問題として知られているようです。この情報は、次のような実装を見つけるのに役立ちます。

Amelio'13Sharma'12Anchuri'12などの一部のコミュニティ検出アルゴリズムも署名済みネットワークを処理するために変更されていることに注意してください。ただし、公的に利用可能な実装を見つけることができませんでした。


0

このコードを見てください。コードは非常にスケーラブルで、ポジティブエッジとネガティブエッジで機能し、相関クラスタリング(CC)を特殊なケース(r = 0)として解決します。ただし、CC(正のリンクを最大化し、クラスター内の負のリンクを最小化する)の場合、この目的の解決に特化した他の方法を提案します。

例として、相関クラスタリングは(コミュニティ検出の文献が追求するものとは異なり)クラスターの正の密度を考慮に入れていないため、ネットワークに負のつながりがないかほとんどない場合(ほとんどの実際のケース)、すべてのネットワークが1つの大きなクラスターにまとめられます集まる。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.