タグ付けされた質問 「t-distribution」

tは、t検定の結果であるt統計の分布です。このタグは、配布に関する質問にのみ使用してください。テストについての質問には[t-test]を使用します。

3
対数変換された予測子および/または応答の解釈
従属変数のみ、従属変数と独立変数の両方、または独立変数のみが対数変換されるかどうかの解釈に違いがあるのか​​と思います。 の場合を考えます log(DV) = Intercept + B1*IV + Error IVはパーセントの増加として解釈できますが、 log(DV) = Intercept + B1*log(IV) + Error または私が持っているとき DV = Intercept + B1*log(IV) + Error ?
46 regression  data-transformation  interpretation  regression-coefficients  logarithm  r  dataset  stata  hypothesis-testing  contingency-tables  hypothesis-testing  statistical-significance  standard-deviation  unbiased-estimator  t-distribution  r  functional-data-analysis  maximum-likelihood  bootstrap  regression  change-point  regression  sas  hypothesis-testing  bayesian  randomness  predictive-models  nonparametric  terminology  parametric  correlation  effect-size  loess  mean  pdf  quantile-function  bioinformatics  regression  terminology  r-squared  pdf  maximum  multivariate-analysis  references  data-visualization  r  pca  r  mixed-model  lme4-nlme  distributions  probability  bayesian  prior  anova  chi-squared  binomial  generalized-linear-model  anova  repeated-measures  t-test  post-hoc  clustering  variance  probability  hypothesis-testing  references  binomial  profile-likelihood  self-study  excel  data-transformation  skewness  distributions  statistical-significance  econometrics  spatial  r  regression  anova  spss  linear-model 

1
OLSモデルの係数が(nk)自由度のt分布に従うことの証明
バックグラウンド 回帰モデルに係数がある通常の最小二乗モデルがあるとします。 kkky=Xβ+ϵy=Xβ+ϵ\mathbf{y}=\mathbf{X}\mathbf{\beta} + \mathbf{\epsilon} ここで、は係数のベクトル、は次で定義される設計行列です。ββ\mathbf{\beta}(k×1)(k×1)(k\times1)XX\mathbf{X} X = ⎛⎝⎜⎜⎜⎜⎜⎜11⋮1バツ11バツ21バツn 1バツ12…⋱………バツ1(k − 1 )⋮⋮バツn(k − 1 )⎞⎠⎟⎟⎟⎟⎟⎟X=(1x11x12…x1(k−1)1x21…⋮⋮⋱⋮1xn1……xn(k−1))\mathbf{X} = \begin{pmatrix} 1 & x_{11} & x_{12} & \dots & x_{1\;(k-1)} \\ 1 & x_{21} & \dots & & \vdots \\ \vdots & & \ddots & & \vdots \\ 1 & x_{n1} & \dots …

4
スチューデントのt分布のパラメーターの推定
スチューデントのt分布のパラメーターの最尤推定量は何ですか?それらは閉じた形で存在しますか?簡単なGoogle検索では結果が得られませんでした。 今日は単変量のケースに興味がありますが、おそらくモデルを複数の次元に拡張する必要があります。 編集:私は実際には主に場所とスケールのパラメータに興味があります。今のところ、自由度パラメーターが固定されていると仮定し、場合によっては後で数値を使用して最適値を見つけることができます。

3
t変量の二乗和とは何ですか?
みましょうでスチューデントのt分布からIID描かれる適度なサイズのため、自由度(100未満を言います)。定義 である有するほぼカイ二乗として配布自由度?ランダム変数の平方和の中心極限定理のようなものはありますか?、N 、N T = Σ 1 ≤ I ≤ K T 2 I T Ktitit_innnnnnT=∑1≤i≤kt2iT=∑1≤i≤kti2T = \sum_{1\le i \le k} t_i^2TTTkkk

3
サンプルサイズが大きくなると、t分布がより正規になるのはなぜですか?
ウィキペディアによると、サンプルが正規分布母集団からのiid観測である場合、t分布はt値のサンプリング分布であることを理解しています。ただし、t分布の形状がファットテールからほぼ完全に正常に変化する理由を直感的に理解できません。 正規分布からサンプリングしている場合、大きなサンプルを取得した場合、その分布に似ていますが、なぜそれが太い尾の形で始まるのかわかりません。

2
2 t分布の差の分布は何ですか
... なぜ ? 想定すると、はそれぞれ平均および分散独立したランダム変数です。私の基本的な統計の本は、分布には次の特性があることを示しています。X1X1X_1X2X2X_2μ1,μ2μ1,μ2\mu_1,\mu_2σ21,σ22σ12,σ22\sigma^2_1,\sigma^2_2X1−X2X1−X2X_1-X_2 E(X1−X2)=μ1−μ2E(X1−X2)=μ1−μ2E(X_1-X_2)=\mu_1-\mu_2 Var(X1−X2)=σ21+σ22Var(X1−X2)=σ12+σ22Var(X_1-X_2)=\sigma^2_1 +\sigma^2_2 Now let's say X1X1X_1, X2X2X_2 are t-distributions with n1−1n1−1n_1-1, n2−2n2−2n_2-2 degrees of freedom. What is the distribution of X1−X2X1−X2X_1-X_2 ? This question has been edited: The original question was "What are the degrees of freedom of the difference of two t-distributions ?". mpiktas …

5
なぜ比率の信頼区間を構築するためにt分布を利用しないのですか?
未知の母標準偏差(sd)を持つ平均の信頼区間(CI)を計算するには、t分布を使用して母標準偏差を推定します。なお、ここで。ただし、母集団の標準偏差のポイント推定値がないため、近似を使用して推定しここでCI=X¯±Z95%σX¯CI=X¯±Z95%σX¯CI=\bar{X} \pm Z_{95\% }\sigma_{\bar X}σX¯=σn√σX¯=σn\sigma_{\bar X} = \frac{\sigma}{\sqrt n}CI=X¯±t95%(se)CI=X¯±t95%(se)CI=\bar{X} \pm t_{95\% }(se)se=sn√se=snse = \frac{s}{\sqrt n} 対照的に、人口の割合については、CIを計算するために、として近似します。ここではおよびCI=p^±Z95%(se)CI=p^±Z95%(se)CI = \hat{p} \pm Z_{95\% }(se)se=p^(1−p^)n−−−−−√se=p^(1−p^)nse = \sqrt\frac{\hat{p}(1-\hat{p})}{n}np^≥15np^≥15n \hat{p} \ge 15n(1−p^)≥15n(1−p^)≥15n(1-\hat{p}) \ge 15 私の質問は、なぜ人口比率の標準分布に満足しているのですか?

1
与えられたMLEでランダムサンプルをシミュレートする
一定の金額を持っていることを条件とするサンプルのシミュレーションについて尋ねるこの相互検証された質問は、ジョージ・カセラによって私に設定された問題を思い出させました。 パラメトリックモデルとこのモデルのiid​​サンプル が与えられると、のMLEは与えられます 指定された値の\ thetaに対して、iidサンプル(X_1、\ ldots、X_n)をシミュレートする一般的な方法がありますMLE \ hat {\ theta}(X_1、\ ldots、X_n)の値を条件としていますか?f(x|θ)f(x|θ)f(x|\theta)(X1,…,Xn)(X1,…,Xn)(X_1,\ldots,X_n)θθ\thetaθ^(x1,…,xn)=argmin∑i=1nlogf(xi|θ)θ^(x1,…,xn)=arg⁡min∑i=1nlog⁡f(xi|θ)\hat{\theta}(x_1,\ldots,x_n)=\arg\min \sum_{i=1}^n \log f(x_i|\theta)θθ\theta(X1,…,Xn)(X1,…,Xn)(X_1,\ldots,X_n)θ^(X1,…,Xn)θ^(X1,…,Xn)\hat{\theta}(X_1,\ldots,X_n) たとえば、位置パラメーター\ muでT5T5\mathfrak{T}_5分布を取り、その密度はf(x | \ mu)= \ dfrac {\ Gamma(3)} {\ Gamma(1/2)\ Gamma( 5/2)} \、\ left [1+(x- \ mu)^ 2/5 \ right] ^ {-3} If (X_1、\ ldots、X_n)\ stackrel {\ text {iid}} {\ sim} f(x | \ mu)\ …

3
サンプルが大きい場合にT分布を使用して平均を推定してみませんか?
基本統計コースでは、標本サイズnが大きい(通常は30または50を超える)場合に、正規分布を使用して母集団パラメーターの平均を推定することをお勧めします。スチューデントのT分布は、サンプルの標準偏差の不確実性を考慮して、より小さいサンプルサイズに使用されます。サンプルサイズが大きい場合、サンプルの標準偏差は母標準偏差に関する適切な情報を提供し、正規分布の推定を可能にします。わかった。 しかし、信頼区間を正確に取得できるのに、なぜ推定値を使用するのでしょうか?サンプルサイズに関係なく、T分布で正確に得られるものの単なる推定値である場合、正規分布を使用するポイントは何ですか?

2
T分布が線形回帰係数の仮説検定に使用されるのはなぜですか?
実際には、標準のT検定を使用して線形回帰係数の有意性を確認するのが一般的です。計算の仕組みは私にとって理にかなっています。 T分布を使用して、線形回帰仮説検定で使用される標準検定統計量をモデル化できるのはなぜですか?私がここで言及している標準の検定統計量: T0=βˆ−β0SE(βˆ)T0=β^−β0SE(β^) T_{0} = \frac{\widehat{\beta} - \beta_{0}}{SE(\widehat{\beta})}

3
統計を使用するタイミングと
信頼区間を計算するためにこのビデオ講義を参照していました。ただし、混乱があります。この男は、計算に統計を使用しています。ただし、それはt統計であるはずだったと思います。母集団の真の標準偏差は与えられません。サンプルの標準偏差を使用して、真の標準偏差を推定しています。zzzttt それでは、なぜ彼はではなく信頼区間の正規分布を取るのでしょうか?ttt

2
不等分散のt検定における非整数の自由度の説明
SPSS t-Testプロシージャは、2つの独立した平均を比較するときに2つの分析を報告します。1つの分析は等分散を仮定し、もう1つは等分散を仮定しません。等しい分散が仮定される場合の自由度(df)は、常に整数値(およびn-2に等しい)です。等分散が仮定されていない場合のdfは非整数(11.467など)であり、n-2の近くにはありません。これらの非整数dfの計算に使用されるロジックと方法の説明を求めています。


2
t分布密度関数の背後にある直感
スチューデントのt分布について勉強していますが、t分布密度関数をどのように導出するのか疑問に思い始めました(ウィキペディア、http://en.wikipedia.org/wiki/Student%27s_t-distributionから): f(t)=Γ(v+12)vπ−−√Γ(v2)(1+t2v)−v+12f(t)=Γ(v+12)vπΓ(v2)(1+t2v)−v+12f(t) = \frac{\Gamma(\frac{v+1}{2})}{\sqrt{v\pi}\:\Gamma(\frac{v}{2})}\left(1+\frac{t^2}{v} \right)^{-\frac{v+1}{2}} ここで、は自由度、Γはガンマ関数です。この機能の直感は何ですか?つまり、二項分布の確率質量関数を見れば、それは理にかなっています。しかし、t分布密度関数は私にはまったく意味がありません...それは一見してまったく直感的ではありません。それとも、それは鐘形の曲線を持ち、それが私たちのニーズを満たすというだけの直観ですか?vvvΓΓ\Gamma 助けのためのThnx :)

1
RのPROC Mixedとlme / lmerの違い-自由度
注:法的な理由で以前の質問を削除する必要があったため、この質問は再投稿です。 SASのPROC MIXED をR lmeのnlmeパッケージの関数と比較していると、やや紛らわしい違いを見つけました。より具体的には、異なるテストの自由度はとの間PROC MIXEDで異なり、lmeなぜだろうと思いました。 次のデータセットから開始します(以下のRコード)。 ind:測定が行われる個人を示す因子 fac:測定が行われる臓器 trt:治療を示す因子 y:連続応答変数 アイデアは、次の単純なモデルを構築することです: y ~ trt + (ind):indランダムな要因として y ~ trt + (fac(ind)):facにネストされたindランダムな要因として、 最後のモデルでは特異性が生じることに注意してください。とのyすべての組み合わせに対しての値は1つだけです。indfac 最初のモデル SASでは、次のモデルを作成します。 PROC MIXED data=Data; CLASS ind fac trt; MODEL y = trt /s; RANDOM ind /s; run; チュートリアルによると、使用しているRの同じモデルnlmeは次のようになります。 > require(nlme) > options(contrasts=c(factor="contr.SAS",ordered="contr.poly")) > m2<-lme(y~trt,random=~1|ind,data=Data) 両方のモデルは、係数とそのSEに対して同じ推定値を与えますがtrt、の効果に対してF検定を実行する場合、異なる自由度を使用します。 SAS …
12 r  mixed-model  sas  degrees-of-freedom  pdf  unbiased-estimator  distance-functions  functional-data-analysis  hellinger  time-series  outliers  c++  relative-risk  absolute-risk  rare-events  regression  t-test  multiple-regression  survival  teaching  multiple-regression  regression  self-study  t-distribution  machine-learning  recommender-system  self-study  binomial  standard-deviation  data-visualization  r  predictive-models  pearson-r  spearman-rho  r  regression  modeling  r  categorical-data  data-visualization  ggplot2  many-categories  machine-learning  cross-validation  weka  microarray  variance  sampling  monte-carlo  regression  cross-validation  model-selection  feature-selection  elastic-net  distance-functions  information-theory  r  regression  mixed-model  random-effects-model  fixed-effects-model  dataset  data-mining 

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.