標準的な統計ツールは、[-1,1]の間の値であり、ユニットに依存しない相関係数(Michael Chernickの回答を参照)です。相関係数に関連するのは共分散です。共分散は単位の影響を受けますが、解釈が容易になる場合があります。ただし、一般的なケースでは、これらのオプションのどちらも好きではありません。それらは共形変換に依存しないため、私はそれらが好きではありません。直線の水平線または垂直線が、これらの測定の両方によって非線形であると見なされると考えてください。
より優れたユニットレスオプションは、特異値分解(SVD)を使用することです。SVDは、データを全体への寄与の大きさでランク付けされたコンポーネントに分割します。したがって、最大の特異数と2番目に大きい特異数の比は、線形性の指標になります。この方法を使用するには、最初にデータを集中化する必要があることに注意してください(平均X、Y、Zなどの座標をゼロにします)。
例:Pts:1126640.141 233575.2013; 1126630.008 233572.8567; 1126625.829 233572.7434;
1126625.416 233577.3781;
一元化されたポイント:9.792639127 0.656480018; -0.340591673 -1.68817349; -4.519928343 -1.801499913; -4.932119113 2.833193384;
SVD、Dマトリックス:11.86500017 0; 0 3.813448344
特異値の比率3.111357
上記の比率は、データが交差線形である場合に最適な直線の方向に3倍の長さのデータとして大まかに解釈できます。
ユニットがあり、SVDを必要としないユニットのソリューションの場合。パラメータの1つとしてラインの中心を持つラインフィットを実行します。上記の集中型データを使用するのは簡単です。行pt = 0 0(常に集中型データの場合)行方向= -0.999956849 -0.009289783
線の中心から各点へのベクトルは、点の中心座標です。これらのベクトルの線への投影の長さ(ベクトルドットの絶対値、線の方向)、および垂直ベクトルコンポーネントの長さ(ベクトルの線の交差方向の長さ)を求めます。長さ平行、長さ垂直9.798315123、0.565480194; 0.356259742、1.684936621、4.536468847、1.759433021、4.905586534、2.878889448、
平行投影の最大値は、線に沿ったデータのストレッチです。垂直投影の最大長は、非線形性の尺度です。2つの比率は、上記の特異値の比率の近似値です。
注1.線形性のアフィン不変性は不可能です。アフィン変換では、1つを除くすべての座標軸をゼロ近くにスケーリングできる(ポイントのセットを線形にする)ことを検討してください。したがって、共形不変性は私たちにできる最善の方法です。2.これらの方法は、外れ値データに対する信頼性はありません。3.例は2Dですが、N次元に一般化されています。