地理的に重み付けされた回帰分析のヌル値


12

一部の説明変数には、特定のポリゴンに対していくつかのヌル値があります。

Geographically Weighted Regression Analysisはこれらを処理できますか、またはポリゴン全体とすべてのデータ(その特定のポリゴンの従属変数と独立変数)を削除する必要がありますか?


これらのヌルは何を表していますか?値が適用されない、または存在するが不明であること 後者の場合、なぜ不明なのですか?(主な懸念は、値が不明である理由が値自体に何らかの形で関連しているかどうかです。たとえば、水文学を研究しており、説明変数として土地被覆を使用している場合、洪水のために土地被覆が不明である場合、それは重要な情報であり、単なる欠損値以上のものを意味します。)
whuber

1
ありがとうございます。nullの一部は、集約の小さな単位のために機密性のために省略されたデータを表します。その他は、単に利用できませんが、他の変数に影響する説明変数の結果ではありません。ゼロはその特定のポリゴンのイベント/レートを表さない真のゼロ値を持ち、データが欠落しているいくつかのヌル値も持っています。最初に約29の説明変数があるため、nullを含む行のポリゴンを取り出すと、279個のうち8個のポリゴンが失われ、必要がないことを望んでいました。ありがとうございました!
私のハートはビート

行方不明についての情報と理論を持っていることを嬉しく思います。ほぼすべての変数の値は、それが表す領域のサイズに関連している可能性があるため、これらの小さな単位には少し注意する必要があります。これにより、欠落パターンの潜在的なバイアスが作成されます。
whuber

2
変数の存在を示す変数を導入し、すべての元のnull結果を共通の値でエンコードすることにより、nullを組み込むことができます(選択した値は実際には重要ではありません)。nullを含む変数ごとに1つの個別のインジケーターが必要です。何をするにしても、nullをゼロ(またはその他の定数)に置き換えるだけではいけません!nullは、ゼロとはまったく異なるものを意味します。
whuber

1
@whuberあなたのコメントにはこれに関する答えを書くのに十分なものがあるようです。
PolyGeo

回答:


1

周囲のデータから「null」値を推測しようとすることができます。データを失うことはないので、それらを除外するよりも良いでしょう。もちろん、値の推測方法には注意する必要があります。推測に偏りがあると、モデルも偏るからです。

参照:http : //handbook.cochrane.org/chapter_16/16_1_2_general_principles_for_dealing_with_missing_data.htm

そして:

注意:

シェープファイルを使用するときは常に、null値を格納できないことに注意してください。結果として、非シェープファイル入力からシェープファイルを作成するツールまたはその他のプロシージャは、null値をゼロまたは非常に小さな負の数(-DBL_MAX = -1.7976931348623158e + 308)として格納する場合があります。これにより、予期しない結果が生じる可能性があります。シェープファイル出力のジオプロセシングに関する考慮事項も参照してください。(http://desktop.arcgis.com/en/arcmap/10.3/tools/spatial-statistics-toolbox/geographically-weighted-regression.htm

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.