本当に答えはありません。1からNの間です。
ただし、利益の観点から考えることができます。
たとえば、マーケティングでは、クラスタリングによく似たセグメンテーションを使用します。
各個人に合わせたメッセージ(広告や手紙など)の応答率が最も高くなります。平均に合わせて調整された一般的なメッセージの応答率は最も低くなります。3つのセグメントに合わせた3つのメッセージを言うことは、その中間のどこかになります。これが収益面です。
各個人に合わせたメッセージは、コストが最も高くなります。平均に合わせた一般的なメッセージは、コストが最も低くなります。3つのセグメントに合わせて調整された3つのメッセージは、中間のどこかにあります。
カスタムメッセージを書くためにライターに支払う費用は1000、2つは2000である、などと言います。
1つのメッセージを使用すると、収益は5000になります。顧客を2つのセグメントにセグメント化し、各セグメントに合わせたメッセージを作成した場合、応答率は高くなります。収益は現在7500です。3つのセグメント、わずかに高い応答率、収益は9000です。もう1つのセグメントで、9500です。
利益を最大化するには、セグメント化による限界収益がセグメント化の限界費用と等しくなるまで、セグメント化を続けます。この例では、3つのセグメントを使用して利益を最大化します。
Segments Revenue Cost Profit
1 5000 1000 4000
2 7500 2000 5500
3 9000 3000 6000
4 9500 4000 5500
hopack
クラスター数を推定できる(および他の)R / BioCパッケージがありますが、それはあなたの質問に答えません。