回答:
これらのパラメータを選択する方法を提案する出版物がたくさんあります。
最も注目すべきはOPTICSです。これは、イプシロンパラメーターを排除するDBSCANバリエーションです。「可能なすべてのイプシロンでDBSCANを実行する」とおおまかに見ることができる階層的な結果を生成します。
minPtsのために、私がやることをお勧めしませ自動方法に依存しているが、あなたにドメイン知識。
優れたクラスタリングアルゴリズムにはパラメーターがあり、必要に応じてカスタマイズできます。
見落としたパラメータは距離関数です。DBSCANで最初に行うことは、アプリケーションに適した距離関数を見つけることです。ユークリッド距離がすべてのアプリケーションに最適であることに依存しないでください!
k
最近傍分類などと同じであると考える場合、minPtsパラメーターについても同じことが言えます。主な違いは、距離については、「しばしば」賢明なデフォルトがあるということです。ユークリッド距離。一方、minPtsの場合、値はデータ固有です。