タグ付けされた質問 「degrees-of-freedom」

「自由度」という用語は、統計の最終的な計算で変化することのない値の数を表すために使用されます。「有効自由度」にも使用します。

1
RのPROC Mixedとlme / lmerの違い-自由度
注:法的な理由で以前の質問を削除する必要があったため、この質問は再投稿です。 SASのPROC MIXED をR lmeのnlmeパッケージの関数と比較していると、やや紛らわしい違いを見つけました。より具体的には、異なるテストの自由度はとの間PROC MIXEDで異なり、lmeなぜだろうと思いました。 次のデータセットから開始します(以下のRコード)。 ind:測定が行われる個人を示す因子 fac:測定が行われる臓器 trt:治療を示す因子 y:連続応答変数 アイデアは、次の単純なモデルを構築することです: y ~ trt + (ind):indランダムな要因として y ~ trt + (fac(ind)):facにネストされたindランダムな要因として、 最後のモデルでは特異性が生じることに注意してください。とのyすべての組み合わせに対しての値は1つだけです。indfac 最初のモデル SASでは、次のモデルを作成します。 PROC MIXED data=Data; CLASS ind fac trt; MODEL y = trt /s; RANDOM ind /s; run; チュートリアルによると、使用しているRの同じモデルnlmeは次のようになります。 > require(nlme) > options(contrasts=c(factor="contr.SAS",ordered="contr.poly")) > m2<-lme(y~trt,random=~1|ind,data=Data) 両方のモデルは、係数とそのSEに対して同じ推定値を与えますがtrt、の効果に対してF検定を実行する場合、異なる自由度を使用します。 SAS …
12 r  mixed-model  sas  degrees-of-freedom  pdf  unbiased-estimator  distance-functions  functional-data-analysis  hellinger  time-series  outliers  c++  relative-risk  absolute-risk  rare-events  regression  t-test  multiple-regression  survival  teaching  multiple-regression  regression  self-study  t-distribution  machine-learning  recommender-system  self-study  binomial  standard-deviation  data-visualization  r  predictive-models  pearson-r  spearman-rho  r  regression  modeling  r  categorical-data  data-visualization  ggplot2  many-categories  machine-learning  cross-validation  weka  microarray  variance  sampling  monte-carlo  regression  cross-validation  model-selection  feature-selection  elastic-net  distance-functions  information-theory  r  regression  mixed-model  random-effects-model  fixed-effects-model  dataset  data-mining 

1
線形回帰の二乗和誤差の分布?
サンプル分散の分布 これは、は行列形式 xAx '(A:対称)で表すことができ、x'QDQ'x(Q:正規直交、D:対角行列)でも表すことができます。 ∑(Xi−X¯)2σ2∼χ2(n−1)∑(Xi−X¯)2σ2∼χ(n−1)2 \sum\frac{(X_i-\bar{X})^2}{\sigma^2}\sim \chi^2_{(n-1)} ∑(Xi−X¯)2n−1∼σ2n−1χ2(n−1)∑(Xi−X¯)2n−1∼σ2n−1χ(n−1)2 \sum\frac{(X_i-\bar{X})^2}{n-1}\sim \frac{\sigma^2}{n-1}\chi^2_{(n-1)} (X−X¯)2(X−X¯)2(X-\bar{X})^2xAx′xAx′xAx'x′QDQ′xx′QDQ′xx'QDQ'x 何約∑(Yi−β^0−β^1Xi)2∑(Yi−β^0−β^1Xi)2\sum(Y_i-\hat{\beta}_0-\hat{\beta}_1X_i)^2仮定が与えられると、(Y−β0−β1X)∼N(0,σ2)(Y−β0−β1X)∼N(0,σ2)(Y - \beta_0 - \beta_1X)\sim \mathcal{N}(0, \sigma^2)? I図∑(Yi−β^0−β^1Xi)2σ2∼χ2(n−2).∑(Yi−β^0−β^1Xi)2σ2∼χ(n−2)2.\sum\frac{(Y_i-\hat{\beta}_0-\hat{\beta}_1X_i)^2}{\sigma^2}\sim \chi^2_{(n-2)}. しかし、それを証明したり、見せたりする方法はわかりません。 \ chi ^ 2 _ {(n-2)}として正確に配布されていχ2(n−2)χ(n−2)2\chi^2_{(n-2)}ますか?

1
自由度がテーブルの終わりを超えた場合はどうしますか?
私のFテーブルの自由度は、私の大きなサンプルに対して十分高くありません。 たとえば、自由度が5および6744のFがある場合、分散分析の5%の臨界値をどのようにして見つけますか? 自由度の高いカイ2乗検定を行っている場合はどうなりますか? [このような質問はしばらく前に投稿されましたが、OPはエラーを起こし、実際には小さなdfを持っていたため、それを重複に減らしました-しかし、元の大きなdfの質問は、サイトのどこかに回答があるはずです]

2
lmerTest :: anovaの自由度は正しいですか?RM-ANOVAとは大きく異なります
Rでの反応時間実験の結果を分析しています。 私は反復測定ANOVAを実行しました(2レベルの被験者内因子1つと2レベルの被験者間因子1つ)。私は同様の線形混合モデルを実行し、lmerの結果をを使用してANOVA表の形式で要約したいと思いましたlmerTest::anova。 誤解しないでください。同じ結果になるとは思っていませんでしたが、結果の自由度についてはわかりませんlmerTest::anova。それは、主題レベルでの集約のない分散分析を反映しているように思えます。 混合効果モデルの自由度を計算するのは難しいことを私は知っていlmerTest::anovaますが、更新されたものの1つの可能な解決策として言及されています?pvaluesトピック(lme4パッケージ)ます。 この計算は正しいですか?の結果はlmerTest::anova指定されたモデルを正しく反映していますか? アップデート:個人差を大きくしました。の自由度はlmerTest::anova単純なanovaとは異なりますが、なぜ被験者内因子/相互作用に対してそれらがそれほど大きいのかはまだわかりません。 # mini example with ANT dataset from ez package library(ez); library(lme4); library(lmerTest) # repeated measures ANOVA with ez package data(ANT) ANT.2 <- subset(ANT, !error) # update: make individual differences larger baseline.shift <- rnorm(length(unique(ANT.2$subnum)), 0, 50) ANT.2$rt <- ANT.2$rt + baseline.shift[as.numeric(ANT.2$subnum)] anova.ez <- ezANOVA(data = …

1
ウェルチ(1947)のおおよその自由度またはサッタースウェイト(1946)を使用する必要がありますか?
ウェルチのt検定に使用する自由度のおおよその正しい式について混乱しています。Satterthwaite(1946)の公式は最も一般的に引用されている公式ですが、Welchは1947年に代替案を提供しました。 サッタースウェイトの公式: (s2バツ/ nバツ+ s2y/ ny)2(s2バツ/ nバツ)2/( nバツ− 1 )+ (s2y/ ny)2/( ny− 1 )(sx2/nx+sy2/ny)2(sx2/nx)2/(nx−1)+(sy2/ny)2/(ny−1)\frac{\left(s_x^2/n_x +s_y^2/n_y\right)^2}{(s_x^2/n_x )^2/(n_x-1)+(s_y^2/n_y )^2/(n_y-1)} ウェルチの公式: − 2 + (s2バツ/ nバツ+ s2y/ ny)2(s2バツ/ nバツ)2/( nバツ+ 1 )+ (s2y/ ny)2/( ny+ 1 )−2+(sx2/nx+sy2/ny)2(sx2/nx)2/(nx+1)+(sy2/ny)2/(ny+1)-2+ \frac{\left(s_x^2/n_x +s_y^2/n_y\right)^2}{(s_x^2/n_x )^2/(n_x+1)+(s_y^2/n_y )^2/(n_y+1)} 参照: Satterthwaite、FE(1946)。「分散成分の推定値の近似分布」。Biometrics Bulletin、2、6、110-114ページ。 ウェルチ、BL(1947)。「いくつかの異なる母集団分散が関与する場合の「学生」問題の一般化」。Biometrika、34、1 / 2、28-35ページ。


2
一致したペアの自由度がでペアの数から1を引いた理由は何ですか?
Iは、以下のように"自由度"を知ることに慣れあなたは線形モデル有し、\ mathbf {Y} = \ mathbf {X} \ boldsymbol {\ベータ} + \ boldsymbol {\イプシロン} とmathbf {Yを\ } \ in \ mathbb {R} ^ n、\ mathbf {X} \ in M_ {n \ times p}(\ mathbb {R})ランクrの設計行列、\ boldsymbol {\ beta} \ in \ mathbb { R} ^ p、\ boldsymbol {\ epsilon} \ …


1
観測されたイベントと期待されたイベントを比較する方法は?
4つの可能なイベントの頻度の1つのサンプルがあるとします。 Event1 - 5 E2 - 1 E3 - 0 E4 - 12 そして、私は自分のイベントの発生が予想される確率を持っています: p1 - 0.2 p2 - 0.1 p3 - 0.1 p4 - 0.6 4つのイベントの観測頻度の合計(18)を使用して、イベントの予想頻度を計算できますか? expectedE1 - 18 * 0.2 = 3.6 expectedE2 - 18 * 0.1 = 1.8 expectedE1 - 18 * 0.1 = 1.8 expectedE1 - …
9 r  statistical-significance  chi-squared  multivariate-analysis  exponential  joint-distribution  statistical-significance  self-study  standard-deviation  probability  normal-distribution  spss  interpretation  assumptions  cox-model  reporting  cox-model  statistical-significance  reliability  method-comparison  classification  boosting  ensemble  adaboost  confidence-interval  cross-validation  prediction  prediction-interval  regression  machine-learning  svm  regularization  regression  sampling  survey  probit  matlab  feature-selection  information-theory  mutual-information  time-series  forecasting  simulation  classification  boosting  ensemble  adaboost  normal-distribution  multivariate-analysis  covariance  gini  clustering  text-mining  distance-functions  information-retrieval  similarities  regression  logistic  stata  group-differences  r  anova  confidence-interval  repeated-measures  r  logistic  lme4-nlme  inference  fiducial  kalman-filter  classification  discriminant-analysis  linear-algebra  computing  statistical-significance  time-series  panel-data  missing-data  uncertainty  probability  multivariate-analysis  r  classification  spss  k-means  discriminant-analysis  poisson-distribution  average  r  random-forest  importance  probability  conditional-probability  distributions  standard-deviation  time-series  machine-learning  online  forecasting  r  pca  dataset  data-visualization  bayes  distributions  mathematical-statistics  degrees-of-freedom 


2
平均とSDの決定は、1つまたは2つの自由度の損失を意味しますか?
ディストリビューションで自由度がどのように考慮されるかを理解する際に、いくつかの疑問に直面しています。 特に、 Student変数を参照してみましょう。ttt t =x −バツ¯s^=x −バツ¯∑ (バツ私−バツ¯)2N− 1−−−−−−−√(1)(1)t=x−x¯s^=x−x¯∑(xi−x¯)2N−1t=\frac{x-\bar{x}}{\hat{s}}=\frac{x-\bar{x}}{\sqrt{\frac{\sum(x_i-\bar{x})^2}{N-1}}}\tag{1} ここで、はガウス変数、は平均値、はデータから取得した標準偏差。バツxxバツ¯x¯\bar{x}s^=∑ (バツ私−バツ¯)2N− 1−−−−−−−√s^=∑(xi−x¯)2N−1\hat{s}=\sqrt{\frac{\sum(x_i-\bar{x})^2}{N-1}} 生徒の確率密度関数は、f(t )= C(1 +t2ν)−ν+ 12(2)(2)f(t)=C(1+t2ν)−ν+12f(t)=C (1+\frac{t^2}{\nu})^{-\frac{\nu+1}{2}}\tag{2} そして、私の教科書でを見つけます。「は、データから計算された平均値が表示されるため、自由度の損失を意味します」。ν= N− 1ν=N−1\nu=N-1(1 )(1)(1)バツ¯x¯\bar{x} 質問:すべきではありませんか?私は両方持っているとあるので、2人のデータから決定されたパラメータが。ν= N− 2ν=N−2\nu=N-2(1 )(1)(1)s^s^\hat{s}バツ¯x¯\bar{x} 一方、でした2番目の形式では、が表示されないため、おそらくデータの制約として考慮されるのはだけです。しかし、これはあまり意味がありません。(1 )(1)(1)s^s^\hat{s}バツ¯x¯\bar{x} したがって、平均値と標準偏差の両方がデータから決定されるこれらのケースでは、自由度の損失は2ですか、それとも1ですか? これは、より一般的な疑問の一種です。複数のパラメーターがデータから決定されるが、いくつかの点でこれらのパラメーターが関連している場合(および場合と同様)、自由度これらすべてのパラメータを考慮すると失われますか?バツ¯x¯\bar{x}s^s^\hat{s} たとえば、同じデータセットからパラメータを決定するとします。すべてのパラメーターは、データと関数として表すことができます。今、私はすべてのパラメータを一緒に検討します:私は何自由度を失いましたか または単に?qqqp1、p2、。。。、pqp1,p2,...,pqp_1,p_2,...,p_qp2、。。。、pqp2,...,pqp_2,...,p_qp1p1p_1qqq111
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.