一部の説明変数には、特定のポリゴンに対していくつかのヌル値があります。
Geographically Weighted Regression Analysisはこれらを処理できますか、またはポリゴン全体とすべてのデータ(その特定のポリゴンの従属変数と独立変数)を削除する必要がありますか?
これらのヌルは何を表していますか?値が適用されない、または存在するが不明であること 後者の場合、なぜ不明なのですか?(主な懸念は、値が不明である理由が値自体に何らかの形で関連しているかどうかです。たとえば、水文学を研究しており、説明変数として土地被覆を使用している場合、洪水のために土地被覆が不明である場合、それは重要な情報であり、単なる欠損値以上のものを意味します。)
—
whuber
ありがとうございます。nullの一部は、集約の小さな単位のために機密性のために省略されたデータを表します。その他は、単に利用できませんが、他の変数に影響する説明変数の結果ではありません。ゼロはその特定のポリゴンのイベント/レートを表さない真のゼロ値を持ち、データが欠落しているいくつかのヌル値も持っています。最初に約29の説明変数があるため、nullを含む行のポリゴンを取り出すと、279個のうち8個のポリゴンが失われ、必要がないことを望んでいました。ありがとうございました!
—
私のハートはビート
行方不明についての情報と理論を持っていることを嬉しく思います。ほぼすべての変数の値は、それが表す領域のサイズに関連している可能性があるため、これらの小さな単位には少し注意する必要があります。これにより、欠落パターンの潜在的なバイアスが作成されます。
—
whuber
変数の存在を示す変数を導入し、すべての元のnull結果を共通の値でエンコードすることにより、nullを組み込むことができます(選択した値は実際には重要ではありません)。nullを含む変数ごとに1つの個別のインジケーターが必要です。何をするにしても、nullをゼロ(またはその他の定数)に置き換えるだけではいけません!nullは、ゼロとはまったく異なるものを意味します。
—
whuber
@whuberあなたのコメントにはこれに関する答えを書くのに十分なものがあるようです。
—
PolyGeo