はじめに統計クラスで標準の標準テーブルを導入しようとしていますが、だれが最初の標準標準テーブルを作成したのでしょうか?コンピューターが登場する前に、彼らはどのようにそれをしましたか?誰かが総当たりでリーマン合計を手で計算することを考えるとぞっとする。
はじめに統計クラスで標準の標準テーブルを導入しようとしていますが、だれが最初の標準標準テーブルを作成したのでしょうか?コンピューターが登場する前に、彼らはどのようにそれをしましたか?誰かが総当たりでリーマン合計を手で計算することを考えるとぞっとする。
回答:
ラプラスは、集計の必要性を最初に認識し、近似を導き出しました。
正規分布の最初の現代的なテーブルは、フランスの天文学者クリスチャンクランプによって分析されています。。正規分布に関連する表から:短い歴史著者:Herbert A. David出典:The American Statistician、Vol。59、No.4(2005年11月)、pp.309-311:
野心的、Krampは、8進(与えまでD)テーブルを にD にDをおよびにD 補間するために必要な相違点と共に。最初の6つの誘導体書き留め彼は、単にのテイラー級数展開使用についてのとの期間まで。これは、より段階的に進行するために彼を可能にを乗算の際に by
したがって、では、この積はように
しかし...彼はどれほど正確なのでしょうか?OK、例としててみましょう。
すごい!
Gaussian pdfの最新の(正規化された)表現に移りましょう。
(R = sqrt(pi) * pnorm(x, lower.tail = F))
[1] 0.00002363235e-05
素晴らしい!
z = 0.06
(x = z * sqrt(2))
(R = sqrt(pi) * pnorm(x, lower.tail = F))
[1] 0.8262988
近い...
事は...正確にどのくらい近いですか?すべての賛成票を受け取った後、実際の答えをぶら下げておくことができませんでした。問題は、私が試したすべての光学式文字認識(OCR)アプリケーションが信じられないほどオフになっていることでした-オリジナルを見ていたとしても驚くことではありません。だから、私はクリスチャン・クランプが彼の作品の粘り強さを高く評価することを学びました。彼のテーブルプレミアの最初の列に各数字を個人的に入力したからです。
@Glen_bからの貴重な助けの後、今では非常に正確になり、このGitHubリンクの Rコンソールにコピーして貼り付ける準備ができました。
ここに彼の計算の精度の分析があります。自分を引き締めます...
mean(abs(difference))
でdifference = R - kramp
:
[R]と比較して彼の計算が最も発散したエントリでは、最初の異なる小数位の値は8桁目(1億番目)でした。平均(中央値)での彼の最初の「間違い」は10進数の10桁目(10億番目!)でした。そして、いかなる場合でも彼は[R]に完全には同意しませんでしたが、最も近いエントリは13のデジタルエントリまで分岐しません。
mean(abs(R - kramp)) / mean(R)
(と同じall.equal(R[,2], kramp[,2], tolerance = 0)
):
sqrt(mean(difference^2))
。
Chistian Krampの写真または肖像画を見つけた場合は、この投稿を編集してここに配置してください。
HAによると、デイヴィッド[1]は、「1783年には早くも」正規分布のテーブルの必要性を認識し、1799年にKrampによって最初の正規テーブルが作成されました。
ただし、Krampはこれらの一連のLaplaceを使用しませんでした。それらを有効に適用できる間隔にギャップがあったためです。
具体的には、関連するいくつかの文を引用します。
Davidは、テーブルが広く使用されたことを示しています。
したがって、数千のリーマンの合計ではなく、数百のテイラー展開でした。
小さなメモでは、ピンチ(計算機と通常のテーブルのいくつかの記憶された値だけで立ち往生)で、他の値で適切な近似を得るためにシンプソンのルール(および数値積分の関連ルール)を非常にうまく適用しました。そうではありません、すべての精度の数の数字と省略のテーブル*を生成するためにその退屈。[Krampのスケールと精度のテーブルを作成することは、かなり巧妙な方法を使用しても、彼がやったように、かなり大きな作業になります。]
*省略された表とは、精度をあまり損なうことなく、表の値の間の補間を基本的に回避できるものを意味します。あなたが唯一の3桁の精度を中心に言いたい場合は、実際に計算する必要はありませんすべての多くの値を。多項式補間(より正確には、有限差分手法を適用)を効果的に使用しました。これにより、補間ステップで多少の努力が必要な場合、線形補間よりも値が少ないテーブルが可能になり、ロジット変換による補間も実行されました線形補間をかなり効果的にしますが、優れた計算機を持っている場合にのみ使用します)。
[1] Herbert A. David(2005)、
「正規分布に関連する表:短い歴史」、
The American Statistician、Vol。59、No。4(11月)、pp。309-311
[2] Kramp(1799)、
Anatronze desRéfractionsAstronomiques et Terrestres、
ライプツィヒ:Schwikkert
興味深い問題!最初のアイデアは、複雑な数式の統合から生まれたものではないと思います。むしろ、漸近論を組み合わせ論に適用した結果です。ペンと紙の方法には数週間かかる場合があります。前任者のパイの計算と比較して、カールガウスにとってそれほど難しくありません。ガウスのアイデアは勇敢だったと思います。彼にとって計算は簡単でした。
標準のzテーブルを最初から作成する例
1. n個(nは20)の数値の母集団を取得し、そこからサイズr(rは5)のすべての可能なサンプルをリストします。
2.サンプル平均を計算します。nCrサンプル平均を取得します(ここでは、20c5 = 15504平均)。
3.それらの平均は母平均と同じです。サンプル平均の標準偏差を見つけます。
4.サンプル平均のポップ平均と標準偏差を使用して、サンプル平均のzスコアを見つけます。
5. zを昇順に並べ替えて、zがnCr z値の範囲内にある確率を見つけます。
6.値を通常のテーブルと比較します。小さいnは、手計算に適しています。nを大きくすると、通常のテーブル値により近い近似値が生成されます。
次のコードはrにあります。
n <- 20
r <- 5
p <- sample(1:40,n) # Don't be misled!! Here, 'sample' is an r function
used to produce n random numbers between 1 and 40.
You can take any 20 numbers, possibly all different.
c <- combn(p, r) # all the nCr samples listed
cmean <- array(0)
for(i in 1:choose(n,r)) {
cmean[i] <- mean(c[,i])
}
z <- array(0)
for(i in 1:choose(n,r)) {
z[i] <- (cmean[i]-mean(c))/sd(cmean)
}
ascend <- sort(z, decreasing = FALSE)
zが0から下の正の値qの間にある確率; 既知の表と比較してください。比較するには、0〜3.5の間で以下のqを操作します。
q <- 1
probability <- (length(ascend[ascend<q])-length(ascend[ascend<0]))/choose(n,r)
probability # For example, if you use n=30 and r=5, then for q=1, you
will get probability is 0.3413; for q=2, prob is 0.4773