Wilk、MB and Gnanadesikan、R. 1968.データ分析のための確率プロット法。
Biometrika 55:1-17。アクセスできる場合はJstorリンク
この論文は、執筆時点ではほぼ50歳ですが、まだ新鮮で革新的だと感じています。さまざまな興味深い実例を使用して、著者はQQ(分位-分位)およびPP(確率-確率)プロットのフレームワークを使用して、分布をプロットおよび比較するためのさまざまなアイデアを統合および拡張します。ここでの分布とは、その分析で生じるデータまたは数値(残差、対比など)のセットを広く意味します。
これらのプロットの特定のバージョンは数十年前にさかのぼりますが、最も明白なのは通常の確率または通常のスコアプロットです。これらの用語では、変位値-変位値プロット、すなわち、観測された変位値対正規(ガウス)分布からの同じサイズのサンプルからの予測または理論変位値のプロットです。しかし、著者は、控えめながらも自信を持って、他の種類の変位値を調べて結果を自動的にプロットするために、同じアイデアを簡単に拡張できることを示しています。
著者は、ベル電話研究所の両方で、最先端のコンピューティング施設を楽しんでおり、多くの大学や研究機関でさえ追いつくのに10年ほどかかりました。今でも、この論文のアイデアは、彼らが得るよりも広い応用に値します。通常のQQプロット以外のこれらのアイデアのいずれかを含む、まれな入門テキストまたはコースです。ヒストグラムとボックスプロット(それぞれ非常に便利ですが、それでもそれぞれが扱いにくく、いくつかの点で制限されています)は、分布のプロットが導入されたときの主要な定番です。
個人的なレベルでは、この論文の主なアイデアは私のキャリアのほとんどでおなじみですが、数年ごとにそれを読み直すことを楽しんでいます。正当な理由の1つは、著者がシンプルでありながら強力なアイデアを生み出し、真面目な例を使って効果を上げられることの喜びです。もう一つの正当な理由は、簡潔に書かれた論文が、ほんのわずかな大げさな痕跡もなく、主要なアイデアの拡張を示唆する方法です。副次的なヒントやさらなるコメントで明示的にカバーされている主要なアイデアのねじれを再発見しました。
これは、統計グラフィックスに特に関心のある人向けの論文ではありませんが、あらゆる種類の統計に関心のあるすべての人を含むべきだと思います。これは、誰の統計スキルと洞察を開発するのに実際に役立つ分布についての考え方を促進します。