ラスターデータからの信頼区間


8

確率分布を表すラスターデータがあります。つまり、各セルには確率値(この場合、セル内で動物が見つかる確率)があり、すべてのセルの合計が100%になります(特定の動物については知っています)私のラスターの範囲内にあります)。信頼値のベクトルデータを生成できるようにしたい。たとえば、95%の線/ポリゴンは、動物を見つけることを95%確信している境界を示します。

同様に、カーネル密度の見積もりがある場合、総母集団のXX%を含むラスターの最も密度の高い部分に接するXX%のライン/ポリゴンをどのように生成しますか?

ArcGISまたはオープンソースソフトウェアを使用したいと思っています。これを実行するツールがない場合、実装できるアルゴリズムは何ですか?


Mathematicaソリューションは最近mathematica.stackexchange.com/questions/20464に登場しました。
whuber

回答:


3

信頼性は表面的には似ていますが、適用可能な概念ではありません。全体の確率が少なくとも95%である最小の領域を特定したいという質問のように聞こえます。 この領域は、すべての確率を並べ替え、部分合計が最初に95%以上になるまで最高から最低まで累積し、累積された値に対応するセルを選択することで(少なくとも概念的には)取得できます。これは、次のR(オープンソース)の例に示されているように、簡単な解決策になります。

library(raster)
set.seed(17)                   # Seed a reproducible random sequence
nr <- 30                       # Number of rows                    
nc <- 50                       # Number of columns
#
# Create a zone raster for normalizing the probabilities.
#
zone <- raster(ncol=nc, nrow=nr)
zone[] <- 0
#
# Create a probability raster (for illustrating the algorithm later).
#
p <- raster(ncol=nc, nrow=nr)
p[] <- (1:(nc*nr) - 1/2) / (nc*nr) + rnorm(nc*nr, sd=0.5)
p <- abs(focal(p, ngb=5, run=mean))
z <- zonal(p, zone, stat='sum')
p <- p / z[[2]] # This normalizes p to sum to unity as required
#------------------------------------------------------------------------------#
#
# The algorithm begins here.
#
pvec <- sort(getValues(p), decreasing=TRUE) # The probabilities, sorted
d <- cumsum(pvec)                           # Cumulative probabilities
dpos <- d[d <= 0.95]                        # Position to stop
region <- p                                 # Initialize the output
region[p < pvec[length(dpos)]] <- NA        # Exclude the last 5% of the probability
plot(region)                                # Display the result

これは、元の確率を色で示した95%確率領域の結果の画像です。それらは合計で95%をわずかに超えており、最小値を削除しても合計は95%未満に減少します。上部の白い領域には、この領域外の確率の残りの5%が含まれています。必要な輪郭は、白いセルと色付きのセルの間の境界です。

結果

同じ方法がKDEグリッドでも機能します。

この問題に対する簡単なArcGISソリューションはありません。


ああ、表面的なものは私の確率の理解を正しく説明しています。a)私の不適切な言葉の質問を正しく解釈し、b)明確な答えを提供してくれてありがとう。
Regan Sarwas

0

ArcGISでは...

  • 空間統計ツール>再分類>再分類ツール
    • 2つの再分類メソッドを作成します。
    • OldValues = 0〜94.99 | NewValues = 0
      OldValues = 95-100 | NewValues = 1

これにより、0 =信頼区間外、1 = 95%信頼区間内の2つの値を持つ新しいラスターが作成されます。

  • 変換ツール>ラスターから>ラスターからポリゴンツール
    • 入力=再分類されたラスター
      フィールド=値

これにより、2つのFIDを持つベクターポリゴンが作成されます。1つは95%信頼区間の形状で、もう1つは残りのラスターエリアです。単純化オプションを調べて、どの結果がニーズにより適しているかを確認することをお勧めします。

参考までに、同じ方法を適用して、カーネル密度推定のポリゴンを取得します。


多分私ははっきりしていませんでした(私は確率であまりよくありません)。言い換えると、すべてのセルの値の合計は1.0であるため、100x100グリッドの均一な分布では、各セルの値は1/10000になります。ここで、セルの値が中心付近のやや大きい数から端付近のゼロの値まで変化することを想像してください(まだ合計は1.0)。最小値のセルを削除し始めると、最終的には合計0.95になります。あなたが提案したように再分類できるようにするにはどうすればよいですか?
Regan Sarwas

奇妙なことに、データの統計的表現を表示するためにラスターを使用することの理解から、確率値(セル値)は0〜100(またはケースでは0〜1)のいずれかであり、これらの値(セル値)の分布は通常の分布。
マイケルマルキエタ

trueの場合、我々は94.99と95のための0.9499と0.95のsubstitutig値とはいえ、上記の提案された方法を使用してデータを再分類することができますより
マイケルMarkieta

1
このソリューションは、質問で説明されているグリッドを反映していません。入力グリッドは、「データの統計的表現」ではなく、離散的な2次元確率分布を表すものと考えてください。実際のケース(中規模から大規模のグリッド、適度に分散された動物の範囲)では、確率のほとんどが非常に小さく、95%をはるかに下回るので、再分類ではすべての情報が消去され、すべてがゼロになります。
whuber
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.