タグ付けされた質問 「t-distribution」

tは、t検定の結果であるt統計の分布です。このタグは、配布に関する質問にのみ使用してください。テストについての質問には[t-test]を使用します。

1
GLMパラメータの推論には自由度補正を使用する必要がありますか?
この質問は、Martijnのこちらの回答に触発されています。 二項モデルやポアソンモデルのような1つのパラメーターファミリーにGLMを当てはめ、それが(たとえば、準ポアソンとは対照的に)完全な尤度手順であると仮定します。次に、分散は平均の関数です。二項式:およびポアソン。var[X]=E[X]E[1−X]var[X]=E[X]E[1−X]\text{var}[X] = E[X]E[1-X]var[X]=E[X]var[X]=E[X]\text{var}[X] = E[X] 残差が正規分布している場合の線形回帰とは異なり、これらの係数の有限の正確なサンプリング分布は不明であり、結果と共変量のおそらく複雑な組み合わせです。また、GLMの平均の推定値を使用します。これは、結果の分散のプラグイン推定値として使用されます。 ただし、線形回帰と同様に、係数には漸近正規分布があるため、有限標本推論では、それらの標本分布を正規曲線で近似できます。 私の質問は、有限サンプル内の係数のサンプリング分布にT分布近似を使用することで何かを得られるかどうかです。一方で、我々は知っている、ブートストラップやジャックナイフ推定が適切にこれらの矛盾を説明することができるとき、T近似は間違った選択のように思えるので、分散をまだ我々は正確な分布を知りません。一方で、T分布のわずかな保守主義は、​​実際には単純に好まれます。

1
がが無限大に近づくにつれて正規分布に収束するという定理はありますか?
レッツ、定義された平均値との任意の分布で、および標準偏差、。中心極限定理は、 が標準正規分布に分布で収束することを示しています。をサンプル標準偏差で置き換える場合、 がt分布に収束して収束するという定理はあり ますか?大きなためXXXμμ\muσσ\sigman−−√X¯−μσnX¯−μσ \sqrt{n}\frac{\bar{X} - \mu}{\sigma} σσ\sigmaSSSn−−√X¯−μSnX¯−μS \sqrt{n}\frac{\bar{X} - \mu}{S} nnnt分布が正規分布に近づくと、定理は、存在する場合、制限が標準正規分布であると述べることができます。したがって、t分布はあまり有用ではないように思えますがほぼ正常な場合にのみ有用です。これは事実ですか? XXX 可能であれば、が置き換えられたときに、このCLTの証明を含む参照を示しますか?そのような参照は、測定理論の概念を使用することができます。しかし、この時点で私にとって何でも素晴らしいことです。σσ\sigmaSSS


3
正規分布よりも裾が重いt分布
私の講義ノートには、 t分布は通常のように見えますが、裾が少し重いです。 なぜそれが正常に見えるのか理解しています(中心極限定理のため)。しかし、正規分布よりも裾が重いことを数学的に証明する方法と、正規分布よりもどの程度重いかを測定する方法があるかどうかを理解するのに苦労しています。

1
PDFの分布のファミリーは
与えられた(比例定数まで)PDFで分布の家族を考えてみ それはどのように呼ばれますか?名前がない場合、どのように呼びますか?P (X )〜1(1 + α X2)1 / α。p(x)∼1(1+αx2)1/α.p(x)\sim \frac{1}{(1+\alpha x^2)^{1/\alpha}}. それは家族に非常に似ています -distributionsとPDF比例する P (X )〜1tttP (X )〜1(1 + 1νバツ2)(ν+ 1 )/ 2。p(x)∼1(1+1νx2)(ν+1)/2.p(x)\sim \frac{1}{(1+\frac{1}{\nu} x^2)^{(\nu+1)/2}}. とき、我々が持っているトン -distributionと1 DF、別名コーシー分布を。ときα → 0またはν → ∞、我々はガウス分布を得ます。α = ν= 1α=ν=1\alpha=\nu=1tttα → 0α→0\alpha\to 0ν→ ∞ν→∞\nu\to\infty この分布のファミリは、Yang et al。、Heavy-Tailed Symmetric Stochastic Neighbor Embedding、NIPS 2009に記載されていますが、それらを参照するために名前を使用していません。

4
をとして証明する
母集団の平均の信頼区間を含む統計的問題は、次の重み関数の観点から組み立てることができます。 w(α,n)≡tn−1,α/2n−−√for 0&lt;α&lt;1 and n&gt;1.w(α,n)≡tn−1,α/2nfor 0&lt;α&lt;1 and n&gt;1.w(\alpha, n) \equiv \frac{t_{n-1,\alpha/2}}{\sqrt{n}} \quad \quad \quad \quad \text{for } 0<\alpha<1 \text{ and } n > 1. たとえば、無限の超母集団の平均の標準的な古典的なレベルの信頼区間は、次のように書くことができます。1−α1−α1-\alpha CI(1−α)=[x¯n±w(α,n)⋅sn].CI(1−α)=[x¯n±w(α,n)⋅sn].\text{CI}(1-\alpha) = \Bigg[ \bar{x}_n \pm w(\alpha, n) \cdot s_n \Bigg]. 次の関数を使用して、限界および\ lim _ {\ alpha \ uparrow 1} w(\ alpha、n)= 0を確立することは簡単ですT分布。信頼区間のコンテキストでは、これは、信頼レベルを下げると区間が1つのポイントに縮小し、信頼レベルを上げると実際の線全体に拡大することを示しています。保持する必要があるもう1つの直感的なプロパティは、データを取得するにつれて間隔が1つのポイントに縮小することです。つまり、次のことを意味します。limα↓0w(α,n)=∞limα↓0w(α,n)=∞\lim_{\alpha \downarrow 0} w(\alpha, n) …

2
フィッシャーのスチューデントのt分布に対する情報行列は予想されますか?
単変量スチューデントのt分布に対して予想されるフィッシャーの情報マトリックスを導き出すリソースをオンラインで見つけるのに問題があります。誰かがそのようなリソースを知っていますか? t分布に対して予想されるフィッシャーの情報マトリックスを導出する既存のリソースがない場合、私はそれを自分で導出しようとしていますが、行き詰まっています。これまでの私の仕事は次のとおりです。 yi∼t(μ,σ2,v)yi∼t(μ,σ2,v)y_i \sim t(\mu, \sigma^2, v)ここで、は自由度(df)パラメーターです(固定と仮定)。次に、 vvvf(yi)=Γ(v+12)Γ(v2)πvσ2−−−−√(1+1vσ2(yi−μ)2)−(v+1)2f(yi)=Γ(v+12)Γ(v2)πvσ2(1+1vσ2(yi−μ)2)−(v+1)2\begin{align*} f(y_i) &= \frac{\Gamma(\frac{v+1}{2})}{\Gamma(\frac{v}{2})\sqrt{\pi v \sigma^2}}\big(1+\frac{1}{v\sigma^2}(y_i-\mu)^2\big)^{\frac{-(v+1)}{2}} \end{align*} したがって、次の対数尤度関数があります。 logf(yi)=logΓ(v+12)−logΓ(v2)−12log(πvσ2)+−(v+1)2log[1+1vσ2(yi−μ)2]logf(yi)=logΓ(v+12)−logΓ(v2)−12log(πvσ2)+−(v+1)2log[1+1vσ2(yi−μ)2]\begin{align*} log f(y_i)=log\Gamma(\frac{v+1}{2})-log\Gamma(\frac{v}{2})-\frac{1}{2}log(\pi v \sigma^2)+ \frac{-(v+1)}{2}log\big[1+\frac{1}{v\sigma^2}(y_i-\mu)^2\big] \end{align*} ここで一次微分方程式: ∂∂μlogf(yi)=v+122vσ2(yi−μ)1+1vσ2(yi−μ)2∂∂σ2logf(yi)=−12σ2−(v+1)2−1vσ4(yi−μ)21+1vσ2(yi−μ)2∂∂μlogf(yi)=v+122vσ2(yi−μ)1+1vσ2(yi−μ)2∂∂σ2logf(yi)=−12σ2−(v+1)2−1vσ4(yi−μ)21+1vσ2(yi−μ)2\begin{align*} &\frac{\partial}{\partial \mu}logf(y_i)=\frac{v+1}{2}\frac{\frac{2}{v\sigma^2}(y_i-\mu)}{1+\frac{1}{v\sigma^2}(y_i-\mu)^2} \\ & \frac{\partial}{\partial \sigma^2}logf(y_i)= \frac{-1}{2\sigma^2}-\frac{(v+1)}{2} \frac{\frac{-1}{v\sigma^4}(y_i-\mu)^2}{1+\frac{1}{v\sigma^2}(y_i-\mu)^2} \end{align*} そしてここに2階微分方程式があります: ∂∂μ2l o gf(y私)= v +12− 2vσ2+2dv2σ4(y私- μ)2( 1+ 1V σ2(y私- μ)2)2∂∂μ ∂σ2l ogf(y私)= v + 12{ …

3
SVDを実行して欠損値を代入する方法、具体例
SVDを適用する前に欠損値を処理する方法に関する素晴らしいコメントを読みましたが、簡単な例でどのように機能するか知りたいです。 Movie1 Movie2 Movie3 User1 5 4 User2 2 5 5 User3 3 4 User4 1 5 User5 5 1 5 上記のマトリックスを考えると、NAの値を削除すると、User2とUser5しかなくなります。これは、私のUが2×kになることを意味します。しかし、欠損値を予測する場合、Uは5×kである必要があります。これは、特異値とVで乗算できます。 上記のマトリックスで、最初に欠損値のあるユーザーを削除してからSVDを適用して、欠損値を記入する人はいますか?数学記号を使いすぎずに、適用した手順の非常に簡単な説明を提供し、答えを実用的なものにしてください(つまり、数値に別の数値を掛けると答えが得られます)。 次のリンクを読みました。 stats.stackexchange.com/q/33142 stats.stackexchange.com/q/31096 stats.stackexchange.com/q/33103
8 r  missing-data  data-imputation  svd  sampling  matlab  mcmc  importance-sampling  predictive-models  prediction  algorithms  graphical-model  graph-theory  r  regression  regression-coefficients  r-squared  r  regression  modeling  confounding  residuals  fitting  glmm  zero-inflation  overdispersion  optimization  curve-fitting  regression  time-series  order-statistics  bayesian  prior  uninformative-prior  probability  discrete-data  kolmogorov-smirnov  r  data-visualization  histogram  dimensionality-reduction  classification  clustering  accuracy  semi-supervised  labeling  state-space-models  t-test  biostatistics  paired-comparisons  paired-data  bioinformatics  regression  logistic  multiple-regression  mixed-model  random-effects-model  neural-networks  error-propagation  numerical-integration  time-series  missing-data  data-imputation  probability  self-study  combinatorics  survival  cox-model  statistical-significance  wilcoxon-mann-whitney  hypothesis-testing  distributions  normal-distribution  variance  t-distribution  probability  simulation  random-walk  diffusion  hypothesis-testing  z-test  hypothesis-testing  data-transformation  lognormal  r  regression  agreement-statistics  classification  svm  mixed-model  non-independent  observational-study  goodness-of-fit  residuals  confirmatory-factor  neural-networks  deep-learning 

1
t分布に従って正確に何が分布されますか?
t分布の背後にある考え方を理解しようとします。これまでに理解した手順は次のとおりです。 N要素のサンプルを使用して、母平均を推定します。詳細には、母平均の推定値としてサンプル平均を使用します。 見積もりが実際の値にどれだけ近いかを知りたいのです。または、より具体的には、母平均が特定の確率でこの間隔内にあると言えるように、サンプル平均の周囲の間隔をどのくらい大きくする必要があるかを知りたいです。 この質問に答えるために、母集団の値は、既知の平均と標準偏差をもつ正規分布に従って分布していると仮定します。 母集団内の値の分布のパラメータがあれば、母集団の分布と標本のサイズの関数として、標本平均の分布を計算できます。 標本平均の分布も、次の数式で与えられる母集団分布と標準偏差と同じ平均の正規分布であることを示すことができます。ここで、は標本のサイズです。 Ns = σ/ N−−√s=σ/Ns = \sigma/\sqrt{N}NNN サンプル平均の分布があれば、サンプル平均が実際の平均からXだけ離れている確率を簡単に計算できます。つまり、母平均がサンプル平均の周りの特定の間隔内にある確率を計算できます。 。 ほぼ必要なものです。唯一の問題は、実際の設定では、母集団の分布の標準偏差がわからないことが多いことです(これは、母集団の平均値の周囲に標本平均がどのように分布するかを決定するパラメーターです)。 私たちにできることは、母集団標準偏差を標本標準偏差で置き換えることです。言い換えると、正確な未知のパラメータを、その概算で置き換えます。 だから、これが今のところです。母集団STDを標本STDで置き換えることにより、標本平均の分布の推定をさらに悪くします。そして、分布のパラメーターのこの「誤った」値を「補正」するために、分布の形状を変更します(これは正規分布ではなくなったと言います。これはt分布です)。しかし、t分布に従って正確に何が分布されるのでしょうか。母集団STDがわかっている場合、標本平均が母集団平均の周囲にどのように分布しているかがわかります。これで、母集団のSTDはわかりませんが、母集団の平均値の周りの標本平均の分布は変わりません。

1
スチューデントのT検定で標準偏差を修正する必要がありますか?
スチューデントのT検定を使用して、T-Criticalは次のように計算されます。 t = X¯- μ0s / n√t=X¯−μ0s/nt = \frac{\bar{X} - \mu_{0}}{s / \sqrt{n}} 標準偏差の不偏推定に関するウィキペディアの記事を見ると、サンプルのサイズに基づいて測定されたサンプルの標準偏差sの補正係数c 4(n )に言及している正規分布の結果のセクションがあります。質問:c4(n )c4(n)c_4(n) (1)この補正係数は自由度によるので、スチューデントのTテーブルデータに含まれていますか? (2)(1)が「いいえ」の場合、なぜそうでないのですか?

2
正規母集団の小さなサンプルのサンプリング分布は正規ですか、それともt分布ですか?[閉まっている]
休業。この質問には詳細または明確さが必要です。現在、回答を受け付けていません。 この質問を改善してみませんか?詳細を追加し、この投稿を編集して問題を明確にしてください。 5年前休業。 母集団が正規分布していることを知っていて、この母集団から小さなサンプルを取得する場合、サンプリング分布が正常であるか、または代わりにt分布に従うと主張する方が正しいですか? 小さなサンプルはt分布する傾向があることを理解していますが、これは、基になる人口分布が不明な場合にのみ適用されますか? ありがとう!

2
nが増加すると、t値は仮説検定で増加しますが、tテーブルは正反対です。どうして?
以下のための式仮説検定では、次式で与えられる。 T = ˉ X - μtttt = X¯- μσ^/ n−−√。t=バツ¯−μσ^/ん。 t=\frac{\bar{X}-\mu}{\hat \sigma/\sqrt{n}}. 場合が増加すると、T上記式に従って-value増加します。しかし、なぜdf(nの関数)が増加すると、tテーブルの臨界t値が減少するのでしょうか。んんntttttttttdfdf\text{df}んんn

1
t学生のエラーがあるARMAプロセスの無条件分布
でモデルの誤差が正規分布を持つ場合、無条件の分布ノーマルです。エラーに自由度のt学生分布がある場合。の無条件分布とは何ですか?Yt∼ARMA(p,q)Yt∼ARMA(p,q)Y_t\sim ARMA(p,q)YtYtY_tνν\nuYtYtY_t したがって、 whereです。Yt=ϕ1Yt−1+⋯+ϕpYt−p+et−θ1et−1−⋯−θqet−qYt=ϕ1Yt−1+⋯+ϕpYt−p+et−θ1et−1−⋯−θqet−qY_t=\phi_1Y_{t-1}+\dots+\phi_pY_{t-p}+e_t-\theta_1e_{t-1}-\dots-\theta_q e_{t-q}et∼tνet∼tνe_t\sim t_\nu 私はそれの分布を見つける方法や、主にガウシアンエラーのケースのみをカバーしている本を見つける方法を知りません。 いくつかの参照も興味深いでしょう。

2
平均とSDの決定は、1つまたは2つの自由度の損失を意味しますか?
ディストリビューションで自由度がどのように考慮されるかを理解する際に、いくつかの疑問に直面しています。 特に、 Student変数を参照してみましょう。ttt t =x −バツ¯s^=x −バツ¯∑ (バツ私−バツ¯)2N− 1−−−−−−−√(1)(1)t=x−x¯s^=x−x¯∑(xi−x¯)2N−1t=\frac{x-\bar{x}}{\hat{s}}=\frac{x-\bar{x}}{\sqrt{\frac{\sum(x_i-\bar{x})^2}{N-1}}}\tag{1} ここで、はガウス変数、は平均値、はデータから取得した標準偏差。バツxxバツ¯x¯\bar{x}s^=∑ (バツ私−バツ¯)2N− 1−−−−−−−√s^=∑(xi−x¯)2N−1\hat{s}=\sqrt{\frac{\sum(x_i-\bar{x})^2}{N-1}} 生徒の確率密度関数は、f(t )= C(1 +t2ν)−ν+ 12(2)(2)f(t)=C(1+t2ν)−ν+12f(t)=C (1+\frac{t^2}{\nu})^{-\frac{\nu+1}{2}}\tag{2} そして、私の教科書でを見つけます。「は、データから計算された平均値が表示されるため、自由度の損失を意味します」。ν= N− 1ν=N−1\nu=N-1(1 )(1)(1)バツ¯x¯\bar{x} 質問:すべきではありませんか?私は両方持っているとあるので、2人のデータから決定されたパラメータが。ν= N− 2ν=N−2\nu=N-2(1 )(1)(1)s^s^\hat{s}バツ¯x¯\bar{x} 一方、でした2番目の形式では、が表示されないため、おそらくデータの制約として考慮されるのはだけです。しかし、これはあまり意味がありません。(1 )(1)(1)s^s^\hat{s}バツ¯x¯\bar{x} したがって、平均値と標準偏差の両方がデータから決定されるこれらのケースでは、自由度の損失は2ですか、それとも1ですか? これは、より一般的な疑問の一種です。複数のパラメーターがデータから決定されるが、いくつかの点でこれらのパラメーターが関連している場合(および場合と同様)、自由度これらすべてのパラメータを考慮すると失われますか?バツ¯x¯\bar{x}s^s^\hat{s} たとえば、同じデータセットからパラメータを決定するとします。すべてのパラメーターは、データと関数として表すことができます。今、私はすべてのパラメータを一緒に検討します:私は何自由度を失いましたか または単に?qqqp1、p2、。。。、pqp1,p2,...,pqp_1,p_2,...,p_qp2、。。。、pqp2,...,pqp_2,...,p_qp1p1p_1qqq111
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.