統計表に記載されていない(内挿する)値を見つけるにはどうすればよいですか?


19

多くの場合、人々はプログラムを使用してp値を取得しますが、場合によっては-何らかの理由で、テーブルのセットから重要な値を取得する必要がある場合があります。

限られた数の有意水準と限られた数の自由度を持つ統計表が与えられた場合、他の有意水準または自由度(、カイ2乗、表など)で近似臨界値を取得する方法?tF

つまり、テーブル内の値の「間にある」値を見つけるにはどうすればよいですか?

回答:


26

この答えは、主に2つの部分に分かれています。1つ目は線形補間を使用すること、2つ目は変換を使用してより正確な補間を行うことです。ここで説明するアプローチは、利用可能なテーブルが限られている場合の手計算に適していますが、p値を生成するコンピュータールーチンを実装している場合は、代わりに使用する必要があるはるかに優れたアプローチ(手作業で行うのが退屈な場合)があります。

z検定の10%(片側)の臨界値が1.28で、20%の臨界値が0.84であることがわかっている場合、15%の臨界値での大まかな推測は-(1.28 + 0.84)の中間になります。 / 2 = 1.06(実際の値は1.0364)、12.5%の値は10%の値(1.28 + 1.06)/ 2 = 1.17(実際の値1.15+)の中間で推測できます。これはまさに線形補間の機能です-しかし、「中間」ではなく、2つの値の間の途中の部分を調べます。

単変量線形補間

単純な線形補間の場合を見てみましょう。

そのため、近似しようとしている値の近くでほぼ線形であると思われる関数(たとえば)があり、たとえば次のように、値の両側に関数の値があります。バツ

バツy89.316y162015.6

がわかっている2つの値は、12(20-8)離れています。値(おおよその値が必要な値)が、その12の差を8:4(16-8と20-16)の比率でどのように分割するかを見てください。つまり、最初の値から最後までの距離の2/3です。関係が線形の場合、対応するy値の範囲は同じ比率になります。y x y xバツyバツyx

線形補間

だから、とほぼ同じであるべきである16-8y169.315.69.3168208

それはy169.315.69.3168208

再配置:

y169.3+15.69.3168208=13.5

統計テーブルの例:12 dfの以下の重要な値を持つtテーブルがある場合:

2-尾αt0.013.050.022.680.052.180.101.78

12 dfと0.025の両側アルファを持つtの臨界値が必要です。つまり、そのテーブルの0.02行と0.05行の間を補間します。

αt0.022.680.0250.052.18

」の値は、近似に線形補間を使用するt 0.025値です。(BY T 0.025私は実際に意味1 - 0.025 / 2の逆CDFの点T 12分布)。t0.025t0.02510.025/2t12

前のように、分割から間隔0.020.05の比率で0.025 - 0.02 0.05 - 0.025 (すなわち、1 5)及び未知のT -値は、分割すべきであるTの範囲2.682.18と同じ比率で、等価的に、0.025が発生0.025 - 0.02 /0.05 - 0.02 = 1 /0.0250.020.050.0250.020.050.02515tt2.682.180.025沿っ方法の第 X未知よう-range、 T -値が発生する 1 / 6に沿った道の目のT -rangeを。0.0250.02/0.050.02=1/6バツt1/6t

それはまたは同等t0.0252.682.182.680.0250.020.050.02

t0.0252.68+2.182.680.0250.020.050.02=2.680.5162.60

2.56α=0.5

tテーブルの臨界値の線形補間

変換によるより良い近似

ログログ

αログαt0.023.9122.680.0253.689t0.0250.052.9962.18

t0.0252.682.182.68ログ0.025ログ0.02ログ0.05ログ0.02=3.6893.9122.9963.912

または同等に

t0.0252.68+2.182.683.6893.9122.9963.912=2.680.50.2432.56

これは、引用された数字の数に正しいです。これは、xスケールを対数的に変換すると、関係がほぼ線形になるためです。

対数アルファの線形補間
実際、視覚的に曲線(灰色)は直線(青)の上にきちんとあります。

ロジットα=ログα1α=ログ11α1αログ

さまざまな自由度にわたる補間

tFν1/ν

120/ν120/ν

F4νν=601201/νν=80F

F480.95F460.95+1/801/601/1201/60F4120.95F460.95

dfの逆interp

こちらの図と比較してください


これがカイ二乗表です

            Probability less than the critical value
 df           0.90      0.95     0.975      0.99     0.999
______   __________________________________________________

 40         51.805    55.758    59.342    63.691    73.402
 50         63.167    67.505    71.420    76.154    86.661
 60         74.397    79.082    83.298    88.379    99.607
 70         85.527    90.531    95.023   100.425   112.317

57の自由度に対して5%の臨界値(95パーセンタイル)を見つけたいと想像してください。

よく見ると、表の5%の重要な値はここでほぼ直線的に進行していることがわかります。

ここに画像の説明を入力してください

(緑の線は50と60 dfの値を結合します。40と70の点に触れていることがわかります)

したがって、線形補間は非常にうまくいきます。しかしもちろん、グラフを描く時間はありません。線形補間を使用するタイミングと、より複雑なことを試みるタイミングを決定する方法

バツ500.95+バツ700.95/2バツ600.95

67.505+90.531/2=79.018

バツ67.50579.08267.50557506050

バツ67.505+79.08267.5055750605075.61

実際の値は75.62375であるため、実際には3桁の精度が得られ、4桁目では1桁しか出ていません。

有限差分の方法を使用することにより(特に、分割された差分を介して)、より正確な補間が行われる場合がありますが、これはほとんどの仮説テスト問題ではおそらく過剰です。

あなたの自由度があなたのテーブルの端を越えて行くなら、この質問はその問題について議論します。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.