最初の標準標準テーブルを作成したのは誰ですか？

はじめに統計クラスで標準の標準テーブルを導入しようとしていますが、だれが最初の標準標準テーブルを作成したのでしょうか？コンピューターが登場する前に、彼らはどのようにそれをしましたか？誰かが総当たりでリーマン合計を手で計算することを考えるとぞっとする。

— ダニエル・スモルキン
ソース

歴史に基づいた教育を受けたいと思っている人に会えてうれしいです。

— -mdewey

回答:

ラプラスは、集計の必要性を最初に認識し、近似を導き出しました。

\begin{aligned} G (x) & = \int_{x}^{\infty} e^{- t^{2}} d t \\ (1) & = \frac{1}{x} - \frac{1}{2 x^{3}} + \frac{1 \cdot 3}{4 x^{5}} - \frac{1 \cdot 3 \cdot 5}{8 x^{7}} + \frac{1 \cdot 3 \cdot 5 \cdot 7}{16 x^{9}} + \dots \end{aligned}

$\begin{align}G(x)&=\int_x^\infty e^{-t^2}dt\\[2ex]&=\small \frac1 x- \frac{1}{2x^3}+\frac{1\cdot3}{4x^5} -\frac{1\cdot 3\cdot5}{8x^7}+\frac{1\cdot 3\cdot 5\cdot 7}{16x^9}+\cdots\tag{1} \end{align}$

正規分布の最初の現代的なテーブルは、フランスの天文学者クリスチャンクランプによって分析されています。。正規分布に関連する表から：短い歴史著者：Herbert A. David出典：The American Statistician、Vol。59、No.4（2005年11月）、pp.309-311：

野心的、Krampは、8進（与え $8$ までD）テーブルを $x = 1.24,$ $9$ にD $1.50,$ $10$ にDを $1.99,$ および $11$ にD $3.00$ 補間するために必要な相違点と共に。最初の6つの誘導体書き留め $G(x),$ 彼は、単にのテイラー級数展開使用 $G(x + h)$ についての $G(x),$ と $h = .01,$ $h^3.$ の期間までこれは、より段階的に進行するために彼を可能に $x = 0$ を $x = h, 2h, 3h,\dots,$ 乗算の際に $h\,e^{-x^2}$ by
$1 - h x + \frac{1}{3} (2 x^{2} - 1) h^{2} - \frac{1}{6} (2 x^{3} - 3 x) h^{3} .$ $1-hx+ \frac 1 3 \left(2x^2 - 1\right)h^2 - \frac 1 6 \left(2x^3 - 3x\right)h^3.$ したがって、 $x = 0$ では、この積は $.01 (1 - \frac{1}{3} \times .0001) = .00999967,$ $.01 \left(1 - \frac 1 3 \times .0001 \right) = .00999967,$ ように $G(.01) = .88622692 - .00999967 = .87622725.$

⋮

$\vdots$

しかし...彼はどれほど正確なのでしょうか？OK、例として $2.97$ てみましょう。

すごい！

Gaussian pdfの最新の（正規化された）表現に移りましょう。

$\mathscr N(0,1)$

f_{X} (X = x) = \frac{1}{\sqrt{2 π}} e^{- \frac{x^{2}}{2}} = \frac{1}{\sqrt{2 π}} e^{- {(\frac{x}{\sqrt{2}})}^{2}} = \frac{1}{\sqrt{2 π}} e^{- {(z)}^{2}}

$f_X(X=x)=\large \frac{1}{\sqrt{2\pi}}\,e^{-\frac {x^2}{2}}= \frac{1}{\sqrt{2\pi}}\,e^{-\left(\frac {x}{\sqrt{2}}\right)^2}= \frac{1}{\sqrt{2\pi}}\,e^{-\left(z\right)^2}$

$z = \frac{x}{\sqrt{2}}$ $x = z \times \sqrt{2}$

$P_Z(Z>z=2.97)$ $e^{ax}$ $1/a$ $x$ $\sqrt{2}$

$\sqrt{2\pi}$

\frac{\sqrt{2 π}}{\sqrt{2}} P (X > x) = \sqrt{π} P (X > x)

$\frac{\sqrt{2\pi}}{\sqrt{2}}\,\mathbb P(X>x)=\sqrt{\pi}\,\,\mathbb P(X>x)$

$z=2.97$ $x=z\times \sqrt{2}=4.200214$

(R = sqrt(pi) * pnorm(x, lower.tail = F))
[1] 0.00002363235e-05

素晴らしい！

$0.06$

z = 0.06
(x = z * sqrt(2))

(R = sqrt(pi) * pnorm(x, lower.tail = F))
[1] 0.8262988

$0.82629882$

近い...

事は...正確にどのくらい近いですか？すべての賛成票を受け取った後、実際の答えをぶら下げておくことができませんでした。問題は、私が試したすべての光学式文字認識（OCR）アプリケーションが信じられないほどオフになっていることでした-オリジナルを見ていたとしても驚くことではありません。だから、私はクリスチャン・クランプが彼の作品の粘り強さを高く評価することを学びました。彼のテーブルプレミアの最初の列に各数字を個人的に入力したからです。

@Glen_bからの貴重な助けの後、今では非常に正確になり、このGitHubリンクの Rコンソールにコピーして貼り付ける準備ができました。

ここに彼の計算の精度の分析があります。自分を引き締めます...

[R]値とKrampの近似値の絶対累積差：

$0.000001200764$ $301$ $1$

絶対誤差平均（MAE）を、またはmean(abs(difference))でdifference = R - kramp：

$0.000000003989249$ $3$

[R]と比較して彼の計算が最も発散したエントリでは、最初の異なる小数位の値は8桁目（1億番目）でした。平均（中央値）での彼の最初の「間違い」は10進数の10桁目（10億番目！）でした。そして、いかなる場合でも彼は[R]に完全には同意しませんでしたが、最も近いエントリは13のデジタルエントリまで分岐しません。

平均相対差またはmean(abs(R - kramp)) / mean(R)（と同じall.equal(R[,2], kramp[,2], tolerance = 0)）：

$0.00000002380406$

根二乗誤差平均（RMSE）として計算または偏差を（大ミスに対してより重みを与えます）sqrt(mean(difference^2))。

$0.000000007283493$

Chistian Krampの写真または肖像画を見つけた場合は、この投稿を編集してここに配置してください。

— アントニ・パレラダ
ソース

2つの異なる参照を持つことは素晴らしいことであり、ここで追加の詳細（ラプラスがアッパーテールに与えた明示的な拡張など）が良いと思います。

— -Glen_b

これは最新の編集ではさらに良くなりますが、私は2回賛成することはできません。しかし、それはほとんどの統計的なアプリケーションのために、まだ十分以上だ- Krampの表は、（最初のステップでは非常に小さな誤差が貫通した）に示す全ての数字に正確さを持っていなかった理由Davidの記事が説明していることに注意してください

— Glen_b

@OlivierGrégoire誤って入力された10進数を指摘していただきありがとうございます。現在は修正されています。私はフランス語が必須だった時代に育ちましたが、私の言語の風変わりな使用に失礼を意味することは決してありませんでした（そこに参照がありますが、気になりません）。「citoyen Kramp」について-論文で歴史的な導入形態を強調する試み。

— アントニ・パレラダ16

ちょっと、ごめんなさい、これはバッシングコメントだと感じました。私はただ何かを指していた、私はあなたが何かを軽視していると言っているわけではない。もちろん、あなたはしゃがんだり、誇張したり（あるいは参考にしたり）するかもしれません。しかし、フランス語を話す人として、私はそれを得ませんでした（少なくともそれを伝えようとしました）。「Le citoyen Kramp」には問題はありませんでした。英語ではないので、コピーして引用しました。バッシングコメントだと感じた場合は申し訳ありませんが、そうではありません。私の英語の使い方も不足しています。^^あなたの比較はうまく行われました！

— オリビエグレゴワール

@ P.Windridge申し訳ありませんが...私は...切断されたハイパーリンクの束を持っていた実現

— アントニParellada

HAによると、デイヴィッド[1]は、「1783年には早くも」正規分布のテーブルの必要性を認識し、1799年にKrampによって最初の正規テーブルが作成されました。

$0$ $x$ $e^{-t^2}$ $\frac{_1}{^2}$

ただし、Krampはこれらの一連のLaplaceを使用しませんでした。それらを有効に適用できる間隔にギャップがあったためです。

$x$ $G(x+h)$ $G$

具体的には、関連するいくつかの文を引用します。

$G(x + h)$ $G(x)$ $h = .01$ $h^3$ $x = 0$ $x = h, 2h, 3h,...$ $he^{-x^2}$
$1 - h x + \frac{1}{3} (2 x^{2} - 1) h^{2} - \frac{1}{6} (2 x^{3} - 3 x) h^{3} .$ $1-hx+ \frac13(2x^2 - 1)h^2 - \frac16(2x^3 - 3x)h^3.$ $x = 0$ $.01 (1 - \frac{1}{3} \times .0001) = .00999967, (4)$ $.01 (1 - \frac13 \times .0001 ) = .00999967,\qquad\qquad (4)$ $G(.01) = .88622692 - .00999967 = .87622725$ $10^{-9}$

Davidは、テーブルが広く使用されたことを示しています。

したがって、数千のリーマンの合計ではなく、数百のテイラー展開でした。

小さなメモでは、ピンチ（計算機と通常のテーブルのいくつかの記憶された値だけで立ち往生）で、他の値で適切な近似を得るためにシンプソンのルール（および数値積分の関連ルール）を非常にうまく適用しました。そうではありません、すべての精度の数の数字と省略のテーブル*を生成するためにその退屈。[Krampのスケールと精度のテーブルを作成することは、かなり巧妙な方法を使用しても、彼がやったように、かなり大きな作業になります。]

*省略された表とは、精度をあまり損なうことなく、表の値の間の補間を基本的に回避できるものを意味します。あなたが唯一の3桁の精度を中心に言いたい場合は、実際に計算する必要はありませんすべての多くの値を。多項式補間（より正確には、有限差分手法を適用）を効果的に使用しました。これにより、補間ステップで多少の努力が必要な場合、線形補間よりも値が少ないテーブルが可能になり、ロジット変換による補間も実行されました線形補間をかなり効果的にしますが、優れた計算機を持っている場合にのみ使用します）。

[1] Herbert A. David（2005）、
「正規分布に関連する表：短い歴史」、
The American Statistician、Vol。59、No。4（11月）、pp。309-311

[2] Kramp（1799）、
Anatronze desRéfractionsAstronomiques et Terrestres、
ライプツィヒ：Schwikkert

— グレン_b
ソース

興味深い問題！最初のアイデアは、複雑な数式の統合から生まれたものではないと思います。むしろ、漸近論を組み合わせ論に適用した結果です。ペンと紙の方法には数週間かかる場合があります。前任者のパイの計算と比較して、カールガウスにとってそれほど難しくありません。ガウスのアイデアは勇敢だったと思います。彼にとって計算は簡単でした。

標準のzテーブルを最初から作成する例
1. n個（nは20）の数値の母集団を取得し、そこからサイズr（rは5）のすべての可能なサンプルをリストします。
2.サンプル平均を計算します。nCrサンプル平均を取得します（ここでは、20c5 = 15504平均）。
3.それらの平均は母平均と同じです。サンプル平均の標準偏差を見つけます。
4.サンプル平均のポップ平均と標準偏差を使用して、サンプル平均のzスコアを見つけます。
5. zを昇順に並べ替えて、zがnCr z値の範囲内にある確率を見つけます。
6.値を通常のテーブルと比較します。小さいnは、手計算に適しています。nを大きくすると、通常のテーブル値により近い近似値が生成されます。

次のコードはrにあります。

n <- 20  
r <- 5  

p <- sample(1:40,n)  # Don't be misled!! Here, 'sample' is an r function  
                     used to produce n random numbers between 1 and 40.  
                     You can take any 20 numbers, possibly all different.  

c <- combn(p, r)     # all the nCr samples listed  
cmean <- array(0)  

for(i in 1:choose(n,r)) {  
    cmean[i] <- mean(c[,i])  
                }  

z <- array(0)  
for(i in 1:choose(n,r)) {  
    z[i] <- (cmean[i]-mean(c))/sd(cmean)  
                }  

ascend <- sort(z, decreasing = FALSE)

zが0から下の正の値qの間にある確率; 既知の表と比較してください。比較するには、0〜3.5の間で以下のqを操作します。

q <- 1  
probability <- (length(ascend[ascend<q])-length(ascend[ascend<0]))/choose(n,r)   
probability   # For example, if you use n=30 and r=5, then for q=1, you  
              will get probability is 0.3413; for q=2, prob is 0.4773

— Md Towhidul Islam
ソース

この方法でサンプリングを使用してテーブルを生成する方法はわかりません。OPは誰が最初の人物かを知りたかっただけだと思う

— マイケルチャーニック

貴重なコメントMichael Chernickに感謝します。1）OPは、「コンピューターが登場する前にどのように行ったのか。誰かが総当たりでリーマンの合計を手で計算するブルートフォースを考えるとぞっとする」と書いています。私はその部分に答えようとしました。2）「サンプル」という用語自体はサンプルではなく、乱数のリストを生成するr関数です。代わりに20個の数字を使用することもできます。ここでのサポートRのリンクを参照してくださいstackoverflow.com/questions/17773080/...

— メリーランドTowhidulイスラム教