統計学で何か新しいことをしようとすると同様の問題があるので、私はあなたの難しさを理解しています(私は大学院生でもありますが、異なる分野です)。Rコードを調べると、何かがどのように計算されるかを知るのに非常に役立ちます。たとえば、最近、kmeansクラスタリングの使用方法を学び、概念と実装方法の両方について多くの基本的な質問をしています。Rインストールを使用して(http://www.rstudio.org/を推奨R Studioしますが、どのインストールでも機能します)、kmeansコマンドラインに入力するだけです。出力の一部の例を次に示します。
x <- as.matrix(x)
m <- nrow(x)
if (missing(centers))
stop("'centers' must be a number or a matrix")
nmeth <- switch(match.arg(algorithm), `Hartigan-Wong` = 1,
Lloyd = 2, Forgy = 2, MacQueen = 3)
if (length(centers) == 1L) {
if (centers == 1)
nmeth <- 3
k <- centers
if (nstart == 1)
centers <- x[sample.int(m, k), , drop = FALSE]
if (nstart >= 2 || any(duplicated(centers))) {
cn <- unique(x)
mm <- nrow(cn)
if (mm < k)
stop("more cluster centers than distinct data points.")
centers <- cn[sample.int(mm, k), , drop = FALSE]
}
}
毎回ソースを調べることがどれほど実用的かはわかりませんが、構文にある程度精通していれば、何が起こっているのかを知るのに本当に役立ちます。
stackoverflowで私が尋ねた以前の質問は、この方向を示してくれましたが、コードに関するコメントが時々ここに含まれていることも教えてくれました。
より一般的には、Journal of Statistical Softwareは理論と実装の間のこのリンクを示していますが、多くの場合、高度なトピック(個人的に理解するのが難しい)についてですが、例として役立ちます。