複数のポイントプロセス(または1つのマークされたポイントプロセス)でクアドラットカウント分析を実行し、いくつかの次元削減手法を適用したいと考えています。
マークは均等に分散されていません。つまり、非常に頻繁に表示されるマークもあれば、非常にまれなマークもあります。したがって、2Dスペースを通常のグリッドで単純に分割することはできません。マークの頻度が高くなると、頻度の低いマークが「圧倒」され、外観がマスクされてしまうためです。
したがって、各セルに最大N個のポイントが含まれるようにグリッドを構築しようとしました(これを行うには、各セルを4つの小さい(同じサイズの)セルに再帰的に分割し、セルがN個を超えるポイントがなくなるまで再帰的にそれ)。
この「正規化」手法についてどう思いますか?そのようなことをする標準的な方法はありますか?
1
通常のグリッドを使用し、マークの頻度が高いほど頻度の高いグリッドよりも数が多い場合、それがどのように「圧倒」され、「マスク」されるかはわかりません。もう少し詳しく説明してもらえますか?各四角形の内容を最も一般的なマークのみ、またはそのようなもので置き換えようとしていますか?
—
ウェイン