次の論文で見つかった主張を再現しようとしています。GeneExpression Dataからの相関バイクラスターの検索です。
命題4.。次にあります:
私。場合加法モデルと完全bicluster、次いで列の相関を持つ完全biclusterあります。 ii。が加法モデルを備えた完全な双である場合、は行に相関がある完全な双クラスターです。 iii。と両方が加法モデルを備えた完全な双クラスターである場合、は完全な相関双クラスターです。 X I J C J X I J R I C J X I J
これらの命題は簡単に証明できます...
...しかし、もちろん、彼らはそれを証明しません。
この命題を実証できるかどうかを確認するために、紙に書かれた簡単な例とベース+カスタムRコードを使用しています。
corbic <- matrix(c(0,4,-4,2,2,-2,6,0,4,-8,16,-2,-2,10,-14,4), ncol=4)
(表1Fから)
論文で説明されているように、標準X = svdフォームをに変換するカスタムコード: X = R C T
svdToRC <- function(x, ignoreRank = FALSE, r = length(x$d), zerothresh=1e-9) {
#convert standard SVD decomposed matrices UEV' to RC' form
#x -> output of svd(M)
#r -> rank of matrix (defaults to length of singular values vector)
# but really is the number of non-zero singular values
#ignoreRank -> return the full decomposition (ignore zero singular values)
#zerothresh -> how small is zero?
R <- with(x, t(t(u) * sqrt(d)))
C <- with(x, t(t(v) * sqrt(d)))
if (!ignoreRank) {
ind <- which(x$d >= zerothresh)
} else {
ind <- 1:r
}
return(list(R=as.matrix(R[,ind]), C=as.matrix(C[,ind])))
}
この関数をデータセットに適用します:
> svdToRC(svd(corbic))
$R
[,1] [,2]
[1,] 0.8727254 -0.9497284
[2,] -2.5789775 -1.1784221
[3,] 4.3244283 -0.7210346
[4,] -0.8531261 -1.0640752
$C
[,1] [,2]
[1,] -1.092343 -1.0037767
[2,] 1.223860 -0.9812343
[3,] 3.540063 -0.9586919
[4,] -3.408546 -1.0263191
私が幻覚である場合を除き、corbicは行と列の間で完全な相関関係を示しますが、この行列は加算的ではありません。彼らが提供する例が、彼らがそうすべきだと言った特性を示すのは奇妙に思えます...私が何らかの種類の前または後のsvd変換ステップを見逃していない限り?
4iii
ことを言うのP(R), P(C), additivity => P(X)
?(私は「Y
完全な二重クラスターです」と略していますP(Y)
)。他の条件からの相加性を期待して、あなたは他の方向に進んでいるようです。もっと説明してください。
4iii
言いません。含意は他の方向に行きます。今、私は彼らが与える例がそれが隣にある定理とジャイブしないように見えることは奇妙であることに同意します。おそらくあなたが提供できる他の情報がありますか?他の方向に向かう他の定理はありますか?X
R
C