ディストリビューションで自由度がどのように考慮されるかを理解する際に、いくつかの疑問に直面しています。
特に、 Student変数を参照してみましょう。
ここで、はガウス変数、は平均値、はデータから取得した標準偏差。
生徒の確率密度関数は、
そして、私の教科書でを見つけます。「は、データから計算された平均値が表示されるため、自由度の損失を意味します」。
質問:すべきではありませんか?私は両方持っているとあるので、2人のデータから決定されたパラメータが。
一方、でした2番目の形式では、が表示されないため、おそらくデータの制約として考慮されるのはだけです。しかし、これはあまり意味がありません。
したがって、平均値と標準偏差の両方がデータから決定されるこれらのケースでは、自由度の損失は2ですか、それとも1ですか?
これは、より一般的な疑問の一種です。複数のパラメーターがデータから決定されるが、いくつかの点でこれらのパラメーターが関連している場合(および場合と同様)、自由度これらすべてのパラメータを考慮すると失われますか?
たとえば、同じデータセットからパラメータを決定するとします。すべてのパラメーターは、データと関数として表すことができます。今、私はすべてのパラメータを一緒に検討します:私は何自由度を失いましたか または単に?