RのHistDataパッケージ(https://r-forge.r-project.org/R/?group_id=574)には、1854年のロンドンでのコレラの発生に関するJohn Snowのマップに関連するデータセットがあります。ウォルター・トブラーの監督の下で慎重にデジタル化された権威です。これらのデータセットの詳細については、John Mackenzieがhttp://www1.udel.edu/johnmack/frec480/cholera/cholera2.htmlで説明しています。
残念ながら、死亡、ポンプ、および道路の座標は、他のGISアプリケーションまたはRのマッピングソフトウェア(空間パッケージ、ggmapなど)に適したマップ座標ではなく、任意の座標系を使用します
でhttp://freakonometrics.hypotheses.org/19213アーサー・シャルパンティエはからスノーデータのバージョンでggmapを使用しています
http://www.rtwilson.com/downloads/SnowGIS_v2.zip。Cholera_Deaths.shp
ただし、このファイルには、私が記録した578人ではなく、489人の死亡のみがリストされていHistData::Snow.deaths
ます。
1つのアイデアは、平均と(x、y)座標の標準偏差との関係を見つけて線形に再スケーリングすることですが、おそらくもっと良い方法がありますか?
ここに私が今まで試したものがあります
> data(Snow.deaths, package="HistData")
> D <- Snow.deaths[,2:3]
> colMeans(D)
x y
13.03312 11.69721
> var(D)
x y
x 3.8150987 0.3802654
y 0.3802654 2.7213828
Cholera_deathsファイルを読む
> folder <- "C:/Dropbox/R/data/Snow/SnowGIS_v2/SnowGIS"
> library(maptools)
> deaths <- readShapePoints(file.path(folder, "Cholera_Deaths"))
> head(deaths@coords)
coords.x1 coords.x2
0 529308.7 181031.4
1 529312.2 181025.2
2 529314.4 181020.3
3 529317.4 181014.3
4 529320.7 181007.9
5 529336.7 181006.0
> # deaths has only 250 observations; 489 deaths
> sum(deaths@data$Count)
[1] 489
> # try to relate to Snow.deaths
> X <- deaths@coords
> colnames(X) <- c("x", "y")
>
> XX <- data.frame(X, Freq=deaths@data$Count)
> XX <- vcdExtra::expand.dft(XX)
>
> colMeans(XX)
x y
529414.8 181031.9
> var(XX)
x y
x 10813.816 1521.693
y 1521.693 6227.924
>
OK、それから私D
はと同じ平均と標準偏差を持つように再スケーリングしようとしXX
ますが、ここでは何かが正しく動作しません-の列の平均は次のDscaled
ものと等しくなるはずですXX
:
> # scale D to have the same means and standard deviations as XX
> Dscaled <- scale(D, center=TRUE, scale=TRUE)
> Dscaled <- scale(Dscaled, center=colMeans(XX), scale=sqrt(diag(var(XX))))
> colMeans(Dscaled)
x y
-5091.040 -2293.947
>
編集:この問題SnowMap(axis.labels=TRUE)
では、HistData
R-Forgeの(rev 102)の開発バージョンで、新しい関数によって描画されたSnowのマップを見ると役立つ場合があります。軸ラベルは、データSnow.*
データセットにあるため、左下隅に座標系の原点を示します。
Snow.*
ファイル内の座標から、精度を確認するために2つまたは3つのポンプの位置を持つGISベースのマップの座標への線形変換を取得できることに気付きました。残念ながら、SnowGIS
ファイルにはポンプのラベルがありません。また、視覚的に比較できるように、それらをプロットする方法の例は見ていません。