回答:
あなたの前の質問に対するあなたのコメントに応えて私が言うように、コルモゴロフ・スミルノフ検定をチェックしてください。統計として、2つの累積分布関数の間の最大絶対距離(または、QQプロットの曲線の45度の線からの最大絶対距離として考えられます)を使用します。KSテストはks.test()
、 'stats'ライブラリのコマンドを使用してRで見つけることができます。ここでは、Rの使用法について詳しく説明します。
私は最近、経験的CDFと近似CDFの相関関係を使用して適合度を定量化しましたが、このアプローチが現在のケースでも役立つのではないかと思います。これは、私が理解しているように、2つの経験的データセットの比較に関係しています。セット間で観測数が異なる場合は、補間が必要になることがあります。
QQプロットの線形性への「直接性」のかなり直接的な測定は、Shapiro-Francia検定統計量です(これは、よく知られたShapiro-Wilkと密接に関連しており、単純な近似と見なすことができます)。
Shapiro-Francia統計は、順序付けられたデータ値と予想される通常の順序統計(「理論的変位値」と呼ばれることもあります)の間の二乗相関です。つまり、プロットに表示される相関の二乗である必要があります。要約メジャー。
(Shapiro-Wilkは類似していますが、次数統計間の相関を考慮に入れています。これは、Shapiro-Franciaと同様の解釈があり、QQプロットの要約とほぼ同じくらい有用です。)
どちらの方法でも、QQプロットが示すものの単一の数の要約の場合、それらの1つは、プロットを要約するのに適した方法です。
個人的には、直線性への近さではなく、直線性からの逸脱を探す傾向があります(見ることをお勧めします)。このスケールは、特定の量の非正規性に対してかなり一定した値を残す傾向があります。
[時々私はを掛ける(は、法線をサンプリングする場合、小さくなる傾向があります)。正常からのサンプリングでは、の平均または中央値は、が変化してもかなり安定する傾向があります。による乗算はまだ完全に正しくはありませんが、部分的に過大に修正されます-結果はとともにと間のどこかで 増加し -しかし、この変動は値の種類に比べて小さいです正常性からの実質的な逸脱を伴う傾向があります。分布があまり変化しないスケールに到達する1 − W ′)n n (1 − W ′)n n n log (n )√ nこれは、変換されたp値に似たものになります(非正規性の量の測定としてはあまり役に立ちませんが、単にランダムな変動ではないかどうかを判断するようなものに興味がある場合はさらに役立ちます)。