本質的に探索的である非常に多種多様なクラスタリング手法があり、階層ベースであろうとパーティションベースであろうと、分散分析のために満たさなければならない種類の仮定に依存しているとは思いません。
あなたの質問に答えるためにStataの[MV]ドキュメントを見て、私は85ページでこの面白い引用を見つけました:
一部の人は、クラスター分析を実行する人々と同じ数のクラスター分析方法があると言っていますが。これはかなり控えめな表現です!クラスター分析を実行する人よりも、クラスター分析を実行する方法が無限に多く存在します。
その文脈では、クラスタリング方法全体に適用される仮定があることを疑います。テキストの残りの部分は、クラスターを作成するためにメトリック距離である必要もない「非類似度」の何らかの形式が必要であるという一般的なルールとして設定されています。
ただし、1つの例外があります。これは、推定後分析の一部として観測値をクラスタリングする場合です。Stataでは、vce
コマンドには同じソースのページ86で次の警告が付いています。
Stataの多数の推定コマンドに精通している場合は、クラスター分析(クラスターコマンド)と多くの推定コマンドで許可されているvce(cluster clustvar)オプションを区別するよう注意してください。クラスター分析は、データ内のグループを見つけます。さまざまな推定コマンドで許可されているvce(cluster clustvar)オプションは、オプションによって定義されたグループ全体で観測値が独立しているが、それらのグループ内で必ずしも独立しているわけではないことを示します。clusterコマンドによって生成されるグループ化変数は、vce(cluster clustvar)オプションの使用の背後にある仮定をめったに満たしません。
それに基づいて、その特定のケース以外では、独立した観測は必要ないと仮定します。直感的に、クラスター分析を使用して、観測値が独立しているかどうかを正確に調べることもできます。
私はでは、以下のことを言及することで終了しますページ356のStataの持つ統計彼はこの問題についてより深くに入りませんが、ローレンス・ハミルトンは、クラスタ分析の「必須」側面として標準化された変数に言及し、。