誰かが私にマハラノビス距離の概念を説明できますか?たとえば、xとyの2点間のマハラノビス距離とは何ですか。特に、パターン認識ではどのように解釈されますか?
誰かが私にマハラノビス距離の概念を説明できますか?たとえば、xとyの2点間のマハラノビス距離とは何ですか。特に、パターン認識ではどのように解釈されますか?
回答:
マハラノビス距離は、いくつかの条件セットが既知の条件セットとどの程度類似しているかを測定する方法を提供します。変数間の共分散を説明します。
次のように計算されます ここで: D 2
このページでは、詳細な説明を提供します(ランドスケープ分析の例を使用)。
マハラノビス距離は、一連のデータから外れ値を見つけるために使用されます。私はあなたがどの分野にいるかはわかりませんが、心理学では、データセットの基準が与えられた場合に予想されるものと「適合」しないケースを識別するために使用されます。たとえば、サンプルがうつ病のレベルが低い個人で構成されており、うつ病のレベルが非常に高い1人または2人の個人がいる場合、それらのマハラノビス距離は予想される臨界値よりも大きくなります。これらのケースが非常に極端で、データセットに適合しないと思われる場合は、これらのケースを削除することをお勧めします。(提供された例を使用すると、サンプルはうつ病のレベルが低い個人で構成されているため、うつ病のレベルが高い1人または2人の個人は他の人とは一致しません)。外れ値を特定することは非常に重要です。なぜなら、多くの統計分析には「正規性の仮定」、つまりデータが正規分布しているという期待があるためです。外れ値もデータの偏りの一因になる可能性があるため、外れ値も削除する必要があります。(変数全体を変換してスキューを修正しない限り)。SPSSなどの多くの統計プログラムでは、Mの距離と各スコアに関連付けられた確率を計算して、外れ値を特定できます。SPSSの手順を提供できますが、SPSSを使用しているかどうかはわかりません。(変数全体を変換してスキューを修正しない限り)。SPSSなどの多くの統計プログラムでは、Mの距離と各スコアに関連付けられた確率を計算して、外れ値を特定できます。SPSSの手順を提供できますが、SPSSを使用しているかどうかはわかりません。(変数全体を変換してスキューを修正しない限り)。SPSSなどの多くの統計プログラムでは、Mの距離と各スコアに関連付けられた確率を計算して、外れ値を特定できます。SPSSの手順を提供できますが、SPSSを使用しているかどうかはわかりません。