実際にポイント単位のユークリッド距離を含むk-meansの解釈については、@ ttnphnsの回答も参照してください。
k-meansの構築方法は、距離に基づいていません。
K-meansは、クラスター内の分散を最小化します。分散の定義を見ると、中心からのユークリッド距離の二乗の合計と同じです。(@ttnphnsの回答は、ペアワイズユークリッド距離を指します!)
k-meansの基本的な考え方は、二乗誤差を最小化することです。ここには「距離」はありません。
任意の距離を使用することが正しくない理由:k-meansは他の距離関数との収束を停止する可能性があるためです。収束の一般的な証明は次のとおりです。割り当てステップと平均更新ステップの両方が同じ基準を最適化します。割り当ての数には限りがあります。したがって、有限数の改善の後に収束する必要があります。他の距離関数のために、この証明を使用するには、ことを示さなければならない平均:(K-ノート手段は、あまりにも、あなたの距離を最小限に抑えること)。
k平均のマンハッタン距離バリアントを探している場合は、k中央値があります。中央値は既知の最良のL1推定量であるためです。
任意の距離関数が必要な場合は、k-medoid(別名:PAM、medoidの周りの分割)を見てください。medoidは任意の距離を最小化します(最小値として定義されているため)。また、有限数の可能なmedoidのみが存在します。しかし、それは平均よりもはるかに高価です。