現在、、、多数の分布を扱っています。T χ 2
これらの自由度が分布などの分布を意味するのはなぜですか?
現在、、、多数の分布を扱っています。T χ 2
これらの自由度が分布などの分布を意味するのはなぜですか?
回答:
これはあまり技術的ではない答えですが、数学の準備が控えめな人にとってはおそらくアクセスしやすいでしょう。
自由度(df)という用語は、さまざまな検定統計量に関連して使用されますが、その意味は統計検定ごとに異なります。一部の検定には、検定統計量に関連付けられた自由度がありません(たとえば、フィッシャーの厳密検定またはz検定)。zテストを実行すると、データに基づいて計算したz値は、サンプルの大きさに関係なく、重要なz値の単一のテーブルに基づいて解釈できます。これを言い換えるもう1つの方法は、1つのz分布があるということです。他のいくつかのテスト(たとえば、Fまたはtまたはχ2)ではそうではありません。
多くの検定統計量をdfに照らして解釈する必要がある理由は、帰無仮説が真であると仮定した場合の検定統計量の(理論的)分布は、サンプルサイズまたはグループ数、あるいはその両方、またはその他の事実に依存するためです。収集したデータについて。t検定を行う場合、t値の分布はサンプルサイズに依存するため、観測データから計算したt値を評価するときは、データと同じサンプルサイズに基づいて予測されるt値と比較する必要があります。同様に、分散分析におけるFの値の分布(帰無仮説が真であると仮定)は、サンプルサイズとグループ数の両方に依存します。したがって、データから計算したF値を解釈するには、データと同じサンプルサイズと同じグループ数に基づいたF値のテーブルを使用する必要があります。これを別の言い方をすると、F検定(ANOVA)とt検定、およびtests2検定はそれぞれ、データに基づいて計算したtまたはFまたはχ2値の解釈に役立つ曲線のファミリーを必要とします。テーブルから読み取った確率がデータに適切になるように、これらのカーブのファミリーから値(つまり、df)に基づいて選択します。(もちろん、ほとんどのコンピュータープログラムがこれを行います。)
F分布は、2つの中央カイ二乗分布の比率です。mは分子を表すカイ2乗確率変数に関連付けられた自由度で、nは分母のカイ2乗の自由度です。質問への回答を完了するには、カイ2乗の自由度を説明する必要があります。自由度がnのカイ2乗分布は、n個の独立したN(0,1)確率変数の二乗の合計として表すことができます。したがって、自由度は、合計に現れる通常の確率変数の数と見なすことができます。
これらの法線に推定パラメーターが含まれている場合、これは変更されます。たとえば、n個の独立したN(m、1)確率変数X i = 1,2、...、nがあるとします。次に、X標本平均= ∑X / nとします。 B I
次に、S = ∑(X -X)計算します。このSはカイ2乗分布になりますが、自由度はn-1です。この場合でも、nの二乗N(0,1)確率変数を合計しています。ただし、ここでの違いは、それぞれが同じXを使用して形成されるため、独立していないこと。したがって、カイ2乗の場合、自由度は、合計の項の数から推定されたパラメーターの数を引いたものに等しいとよく言われます。i b 2 2 b
t分布の場合、N(0、σ)をVで除算すると、Vはσの標本推定です。Vは自由度n-1のカイ2乗に比例します。nはサンプルサイズです。tの自由度は、Vの計算に含まれるカイ2乗確率変数の自由度です。