人口密度推定のモデル


14

(人口、面積、形状)のデータベースを使用して、人口/面積の一定値を各形状(国勢調査区、区域、郡、州などの多角形)に割り当てることにより、人口密度をマッピングできます。ただし、通常、人口はポリゴン内で均一に分布していません。 ダシメトリックマッピングは、補助データを使用してこれらの密度推定値を調整するプロセスです。この最近のレビューが示すように、それは社会科学の重要な問題です。

それでは、土地被覆の補助地図(またはその他の離散的な要因)を利用できると仮定します。最も単純なケースでは、水域のような明らかに居住できないエリアを使用して、人口がいない場所を特定し、それに応じて、すべての人口を残りのエリアに割り当てることができます。より一般的には、各センサスユニットに刻まれている表面領域を有する部分、。これにより、データセットはタプルのリストに追加されますjkxjii=1,2,,k

(yj,xj1,xj2,,xjk)

ここで、はユニットの母集団(エラーなしで測定されたと仮定)であり、厳密にはそうではありませんが、すべてのも正確に測定されたと仮定できます。これらの用語では、目的は各を合計に分割することですyjjxjiyj

yj=zj1+zj2++zjk

ここで、各およびは、土地被覆クラス存在するユニット内の人口を推定します。推定値に偏りがないことが必要です。このパーティションは、密度を国勢調査ポリゴンと土地被覆クラスの交点に割り当てることにより、人口密度マップを改良し。 、Z 、J 、I、J 、I 、Z 、J 、I / X jのI J 番目の I 番目zji0zjijizji/xjijthith

この問題は、顕著な点で標準の回帰設定とは異なります。

  1. 各の分割は正確でなければなりません。 yj
  2. すべてのパーティションのコンポーネントは非負でなければなりません。
  3. (仮定により)どのデータにもエラーはありません。すべての人口カウントおよびすべての領域は正しいです。 x j iyjxji

インテリジェントダシメトリックマッピング」メソッドなど、ソリューションには多くのアプローチがありますが、私が読んだものはすべて、アドホックな要素と明らかなバイアスの可能性を持っています。私は、創造的で計算が扱いやすい統計的手法を示唆する答えを探しています。直接の適用は、cの コレクションに関するものです。 -個々に40人を平均国勢調査単位(かなりの画分が0人を持っているが)とダースの土地被覆クラスに関する。 10 6105106


フォーマットの問題が修正されました。それはバグでした。
ロブハインドマン

@Robありがとう、これを見てくれたすべての人に感謝します。コメントが削除される前に私はあなたのコメントを見て、あなたの努力に感謝しています。
whuber

1
また、これ:P. A ZandbergenとD. A Ignizio、「小面積人口推定のためのDasymetricマッピング手法の比較」、地図作成と地理情報科学37、no。3(2010):199–214。ingentaconnect.com/content/acsm/cagis/2010/00000037/00000003/… これは、ブレンドのために呼び出されるようです。
-fgregg

1
この論文は役に立つかもしれません:Hwahwan KimとXiaobai Yao、「Pycnophylactic Interpolation Revisited:Integration with the dasymetric-mapping method」、International Journal of Remote Sensing 31、no。21(2010):5657. informaworld.com/10.1080/01431161.2010.496805
fgregg

1
ご存じのように、最終的には生態学的推論の問題としてのdasymetricマッピング。K. Imaiの最近の研究が役立つかもしれません:pan.oxfordjournals.org/content/16/1/41.abstract
fgregg

回答:


4

dasymetricマッピングに関するMitchel Langfordの作業を確認することをお勧めします。

彼はウェールズの人口分布を表すラスターを作成し、彼の方法論的なアプローチのいくつかがここで役立つかもしれません。

更新:ジェレミー・メニスの作品もご覧ください(特にこれら 2つの記事)。


2
ありがとうございました。この研究は、最近のダシメトリックマッピングに関する研究のウェブへのポインタを提供します。
whuber

2

興味深い質問。統計的な角度からこれにアプローチする際の暫定的な突きはここにあります。人口カウントを各エリアに割り当てる方法を考えてみましょう。この関係を以下のように示します。xji

zji=f(xji,β)

明らかに、課す関数形式は、せいぜい実際の関係の近似であり、したがって、上記の方程式に誤差を組み込む必要があります。したがって、上記は次のようになります。f(.)

zji=f(xji,β)+ϵji

どこ、

ϵjiN(0,σ2)

誤差項の分布誤差の仮定は、例示を目的としています。必要に応じて、必要に応じて変更できます。

ただし、正確な分解が必要です。したがって、以下のようにエラー項と関数f )に制約を課す必要があります。yjif(.)

iϵji=0

if(xji,β)=yj

積層ベクトル示すによってZ Jとの積層決定論的観点から、F X 、J 、Iβをすることにより、F 、J。したがって、次のものがあります。zjizjf(xji,β)fj

zjN(fj,σ2I)I(fje=yj)I((zjfj)e=0)

どこ、

は適切な次元のもののベクトルです。e

最初のインジケーター制約は、決定論的項の合計がなり、2番目の制約が誤差残差が0になるという考えをキャプチャします。yj

観測された正確に分解するため、モデルの選択は複雑です。おそらく、モデル選択にアプローチする方法は、誤差の分散が最小になるモデル、つまり推定値が最小になるモデルを選択することです。yjσ2

編集1

上記の定式化をさらに考えると、必要以上の制約があるため、単純化できます。

zji=f(xji,β)+ϵji

どこ、

ϵjiN(0,σ2)

よるの積み重ねられたベクトルとよるの積み重ねられた決定論的項を示します。したがって、次のものがあります。zjizjf(xji,β)fj

zjN(fj,σ2I)I(zje=yj)

どこ、

eは適切な次元のもののベクトルです。

の制約により、正確な分解が保証されます。zj


2
@Srikantありがとう。質問を投げかけたとき、私は同様の線に沿って考えていたので、GLM(線形リンク付きポアソン分布)および他のモデルをテストしました。残念ながら、土地被覆タイプと割合のみに基づいたモデルはうまく機能しないようです。これらのデータのサンプルは、人口パターンがより大きな空間的コンテキストに依存していることを示唆しています。その場合、少なくとも、線形モデルに空間的に遅れた共変量を含める必要があります。
whuber
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.