SpatialPolygonsDataFramesを同一のポリゴンIDで正しくバインドする方法は?


22

IDが重複する場合にSPDFをrbindingするための適切なRイディオムは何ですか?ここで(多くの場合そうであるように)IDは基本的に無意味であるため、rbindにそれらを無視させることはできません。

library(sp)
library(UScensus2000)
library(UScensus2000tract)

data(state) # for state names
states <- gsub( " ", "_", tolower(state.name) )
datanames <- paste(states,"tract", sep=".")
data( list=datanames )
lst <- lapply(datanames,get)

nation <- do.call( rbind, lst )
Error in validObject(res) : 
  invalid class SpatialPolygons object: non-unique Polygons ID slot values

# This non-exported function designed to solve this doesn't seem to work any more.
d <- sp:::makeUniqueIDs( list(arizona.tract,delaware.tract) )
Error in slot(i, "ID") : 
  no slot of name "ID" for this object of class "SpatialPolygonsDataFrame"

回答:


15

ID、スロット、および適用タイプの機能。私がやることすべてに絶対に欠かせない、一番好きなもののトップ3。このトピックに関するコンテンツをさらに生成するためだけに応答すると思いました。

以下のコードは機能しますが、「役に立たない」ID値を保持します。より良いコードでは、すべてのトラクトがIDとして州FIPS、郡FIPS、およびトラクトFIPSを持つように、物事を解析するのに時間がかかります。それを実現するためにもう少し行を追加しますが、IDについては気にしないので、ここでは省略します。

#Your Original Code
library(sp)
library(UScensus2000)
library(UScensus2000tract)

data(state) # for state names
states <- gsub( " ", "_", tolower(state.name) )
datanames <- paste(states,"tract", sep=".")
data( list=datanames )
lst <- lapply(datanames,get)

#All good up to here, but we need to create unique ID's before rbind

#Modified from Roger Bivand's response at:
# https://stat.ethz.ch/pipermail/r-sig-geo/2007-October/002701.html

#For posterity: We can access the ID in two ways:
class(alaska.tract)
getSlots(class(alaska.tract))
class(slot(alaska.tract, "polygons")[[1]])
getSlots(class(slot(alaska.tract, "polygons")[[1]]))

#So to get all ID's
sapply(slot(alaska.tract, "polygons"), function(x) slot(x, "ID"))
#or
rownames(as(alaska.tract, "data.frame"))
#These should be the same, but they are quite different...sigh. Doesn't matter for
#what follows though

#To make them uniform we can write a function using the spChFIDs function from sp:
makeUniform<-function(SPDF){
  pref<-substitute(SPDF)  #just putting the file name in front.
  newSPDF<-spChFIDs(SPDF,as.character(paste(pref,rownames(as(SPDF,"data.frame")),sep="_")))
  return(newSPDF)
}

#now to do this for all of our state files
newIDs<-lapply(lst,function(x) makeUniform(x))

#back to your code...
nation <- do.call( rbind, newIDs )

ありがとう。私はこれを数日間チェックするつもりでしたが、人生は介入しました。これほど多くのコード行があることに驚かされます。パッケージrbind内のSPDFメソッドへのパッチを提出する価値があると思いspますか?私はにこのコードのようなものを回すことを考えていた,deduplicateIDs=TRUE....メソッドに引数
アリB.フリードマン

実際には、関数のコードは3行だけで、1つは事前バインドに適用しますが、問題の処理には時間がかかります。SPDFでのIDの処理は常に問題であることがわかりました(たとえば、rgdalで何かを読み込むときはいつでも)が、Roger Bivandは常にそれらを動作させることができるように見えるので、自分の欠点だと思っただけです。パッチのアイデアは気に入っていますが、これらのスロットにアクセスすると、spの他の要素が複雑になるのではないかと思います。
csfowler

素晴らしい答え。他の人にrbindが私のコードで動けなくなるとき、それは通常、以前の間違い(重複IDをもたらす)が原因であるというアドバイスを追加したいだけです。したがって、エラーは正しいです。
クリス

20

これはさらに簡単なアプローチです。

x <- rbind(x1, x2, x3, makeUniqueIDs = TRUE)  

1
これがrbindヘルプページに文書化されていればいいのですが。彼らがこの議論に使用した大文字と小文字のルールを思い出せないたびに、私はここを見る必要があります。間違いなくベストアンサー。もっとコンテキストが必要だとは思わないので、絶対に削除しないでください!
JMT2080AD

ドキュメンテーションは「make.row.names = TRUE)」を示唆しています...これはうまくいかないようです。例のコピー&ペーストは行いました。
モックス

これがヘルプに記載されていない理由は、spオブジェクトをrbindに渡すときにspメソッドを呼び出しているためだと思います。を参照してくださいmethods(class = "SpatialLines")。私はこれについてはわかりませんが、今のところ私の最善の推測です。Edzer and co。rbind自体を維持していないため、rbindにドキュメントがありません。
JMT2080AD

マージするオブジェクトのリストが長い場合(x1, x2, x3, ..., xn)はどうなりますか?すべてを入力せずにリスト全体をキャプチャする方法はありますか?
フィル

列の数が等しい場合にのみ機能します。
デニス

9

さて、ここに私の解決策があります。提案を歓迎します。sp目立たない欠落が見られない限り、これをパッチとして提出する可能性があります。

#' Get sp feature IDs
#' @aliases IDs IDs.default IDs.SpatialPolygonsDataFrame
#' @param x The object to get the IDs from
#' @param \dots Pass-alongs
#' @rdname IDs
IDs <- function(x,...) {
  UseMethod("IDs",x)
}
#' @method IDs default
#' @S3method IDs default
#' @rdname IDs
IDs.default <- function(x,...) {
  stop("Currently only SpatialPolygonsDataFrames are supported.")
}
#' @method IDs SpatialPolygonsDataFrame
#' @S3method IDs SpatialPolygonsDataFrame
#' @rdname IDs
IDs.SpatialPolygonsDataFrame <- function(x,...) {
  vapply(slot(x, "polygons"), function(x) slot(x, "ID"), "")
}

#' Assign sp feature IDs
#' @aliases IDs<- IDs.default<-
#' @param x The object to assign to
#' @param value The character vector to assign to the IDs
#' @rdname IDs<-
"IDs<-" <- function( x, value ) {
  UseMethod("IDs<-",x)
}
#' @method IDs<- SpatialPolygonsDataFrame
#' @S3method IDs<- SpatialPolygonsDataFrame
#' @rdname IDs<-
"IDs<-.SpatialPolygonsDataFrame" <- function( x, value) {
  spChFIDs(x,value)
}

#' rbind SpatialPolygonsDataFrames together, fixing IDs if duplicated
#' @param \dots SpatialPolygonsDataFrame(s) to rbind together
#' @param fix.duplicated.IDs Whether to de-duplicate polygon IDs or not
#' @return SpatialPolygonsDataFrame
#' @author Ari B. Friedman, with key functionality by csfowler on StackExchange
#' @method rbind.SpatialPolygonsDataFrame
#' @export rbind.SpatialPolygonsDataFrame
rbind.SpatialPolygonsDataFrame <- function(..., fix.duplicated.IDs=TRUE) {
  dots <- as.list(substitute(list(...)))[-1L]
  dots_names <- as.character(dots) # store names of objects passed in to ... so that we can use them to create unique IDs later on
  dots <- lapply(dots,eval)
  names(dots) <- NULL
  # Check IDs for duplicates and fix if indicated
  IDs_list <- lapply(dots,IDs)
  dups.sel <- duplicated(unlist(IDs_list))
  if( any(dups.sel) ) {
    if(fix.duplicated.IDs) {
      dups <- unique(unlist(IDs_list)[dups.sel])
      # Function that takes a SPDF, a string to prepend to the badID, and a character vector of bad IDs
      fixIDs <- function( x, prefix, badIDs ) {
        sel <-  IDs(x) %in% badIDs
        IDs(x)[sel] <- paste( prefix, IDs(x)[sel], sep="." )
        x
      }
      dots <- mapply(FUN=fixIDs , dots, dots_names, MoreArgs=list(badIDs=dups) )
    } else {
      stop("There are duplicated IDs, and fix.duplicated.IDs is not TRUE.")
    }
  }
  # One call to bind them all
  pl = do.call("rbind", lapply(dots, function(x) as(x, "SpatialPolygons")))
  df = do.call("rbind", lapply(dots, function(x) x@data))
  SpatialPolygonsDataFrame(pl, df)
}

1

私はここで他の回答の詳細を高く評価しており、それらに基づいて、私が訪れたワンライナーは以下にあります。OPのように、IDの意味についてはあまり気にしませんが、以下は、より有益なIDを埋め込むために適合させることもできます。

lst <- lapply(1:length(lst), function(i) spChFIDs(lst[[i]], paste0(as.character(i), '.', 1:length(lst[[i]]))))
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.