相関行列のSVDは加算的である必要がありますが、


29

次の論文で見つかった主張を再現しようとしています。GeneExpression Dataからの相関バイクラスターの検索です。

命題4.。次にあります:XIJ=RICJT

私。場合加法モデルと完全bicluster、次いで列の相関を持つ完全biclusterあります。 ii。が加法モデルを備えた完全な双である場合、は行に相関がある完全な双クラスターです。 iii。と両方が加法モデルを備えた完全な双クラスターである場合、は完全な相関双クラスターです。 X I J C J X I J R I C J X I JRIXIJ
CJXIJ
RICJXIJ

これらの命題は簡単に証明できます...

...しかし、もちろん、彼らはそれを証明しません。

この命題を実証できるかどうかを確認するために、紙に書かれた簡単な例とベース+カスタムRコードを使用しています。

corbic <- matrix(c(0,4,-4,2,2,-2,6,0,4,-8,16,-2,-2,10,-14,4), ncol=4)

(表1Fから)

論文で説明されているように、標準X = svdフォームをに変換するカスタムコード: X = R C TUdVTX=RCT

svdToRC <- function(x, ignoreRank = FALSE, r = length(x$d), zerothresh=1e-9) {
#convert standard SVD decomposed matrices UEV' to RC' form
#x -> output of svd(M)
#r -> rank of matrix (defaults to length of singular values vector)
            # but really is the number of non-zero singular values
#ignoreRank -> return the full decomposition (ignore zero singular values)
#zerothresh -> how small is zero?

    R <- with(x, t(t(u) * sqrt(d)))
    C <- with(x, t(t(v) * sqrt(d)))

    if (!ignoreRank) {
        ind <- which(x$d >= zerothresh)
    } else {
        ind <- 1:r
    }

    return(list(R=as.matrix(R[,ind]), C=as.matrix(C[,ind])))
}

この関数をデータセットに適用します:

 > svdToRC(svd(corbic))
$R
           [,1]       [,2]
[1,]  0.8727254 -0.9497284
[2,] -2.5789775 -1.1784221
[3,]  4.3244283 -0.7210346
[4,] -0.8531261 -1.0640752

$C
          [,1]       [,2]
[1,] -1.092343 -1.0037767
[2,]  1.223860 -0.9812343
[3,]  3.540063 -0.9586919
[4,] -3.408546 -1.0263191

私が幻覚である場合を除き、corbicは行と列の間で完全な相関関係を示しますが、この行列は加算的ではありません。彼らが提供する例が、彼らがそうすべきだと言った特性を示すのは奇妙に思えます...私が何らかの種類の前または後のsvd変換ステップを見逃していない限り?


3
こんにちは、zzk:(a)誰もが論文にアクセスできるとは限らず、(b)想定している一般性に応じていくつかの異なることを意味する可能性があるため、ここで完全なバイクラスターの定義を簡単に説明すると役立ちます。
枢機

1
基本的に、マトリックスのすべての行対行および列対列間のペアワイズ相関スコアの絶対値は1です
。– zzk

3
よくわかりません。しない4iiiことを言うのP(R), P(C), additivity => P(X)?(私は「Y完全な二重クラスターです」と略していますP(Y))。他の条件からの相加性を期待して、あなたは他の方向に進んでいるようです。もっと説明してください。
スタンピージョーピート

Stumpy-R&Cの加法性を期待しています。なぜなら、私が提供する行列(corbic)が完全な相関関係を示していることを知っているからです。
zzk

6
私はまだあなたが間違った方向に進んでいると思っています。if が完全に相関したバイクラスターである場合、それが加法的になるとは4iii 言いません。含意は他の方向に行きます。今、私は彼らが与える例がそれが隣にある定理とジャイブしないように見えることは奇妙であることに同意します。おそらくあなたが提供できる他の情報がありますか?他の方向に向かう他の定理はありますか?XRC
スタンピージョーピート

回答:


2

この記事の「bicluster」は、マトリックスのサブセット「列のサブセット間で同様の動作を示す行のサブセット、またはその逆」を指すことに注意してください二重クラスターの識別は、一般にデータマイニングアルゴリズムで行われます。著者は、これらのサブセットを識別するために使用された以前のモデルとは異なる新しい「相関バイクラスターモデル」を提案しています。私は遺伝学について何も知りませんが、ここでの混乱は非常に明確であり、2つのソースから来ているようです。

1.「添加剤」という言葉の使用

この論文では、関数の出力で与えられる2つの行列が「加算的」であるべきであることを示唆するものは何もありません。この意味で著者は単語の添加物を使用していません。彼らは、「各行または列は別の行または列に定数を追加することで取得できる」加算モデルでバイクラスターを取得することを指します。

2.命題4.3の誤読

RICJバツJバツJRCJRCJ 逆相加的であるか、加法モデルに適合できる必要があります。

*また、サンプルデータは、質問で議論された命題とはまったく異なる論文のセクションからのものです。


私たちのウェブサイトで最も支持されている未回答の質問が、最終的に回答されたのを見るのは素晴らしいことです!+1を読んでいないのに、あなたが書いたものが正しいことを保証することはできません。しかし、それは合理的なようです。
アメーバは、モニカを
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.