タグ付けされた質問 「variance」

確率変数の平均からの予想される二乗偏差。または、それらの平均についてのデータの平均二乗偏差。

3
決定係数(
r 2の概念を完全に把握したいr2r2r^2変数間の変動量を表すます。すべてのウェブの説明は少し機械的で鈍いです。単に機械的に数字を使用するのではなく、コンセプトを「取得」したい。 例:学習時間とテストスコア rrr = .8 r2r2r^2 = .64 それで、これはどういう意味ですか? テストスコアの変動の64%は時間単位で説明できますか? どうすれば二乗するだけでそれを知ることができますか?

2
単純な線形回帰では、残差の分散の式はどこから来ますか?
私が使用しているテキストによると、残差の分散の式は次のようになります。ithithi^{th} σ2(1−1n−(xi−x¯¯¯)2Sxx)σ2(1−1n−(xi−x¯)2Sxx)\sigma^2\left ( 1-\frac{1}{n}-\frac{(x_{i}-\overline{x})^2}{S_{xx}} \right ) 残差は観測値と適合値の差であるため、これは信じがたいことです。差の分散を計算する場合、少なくとも、結果の式にいくつかの「プラス」が期待されます。派生を理解する上で助けていただければ幸いです。ithithi^{th}ithithi^{th}ithithi^{th}

4
新しいベクターをPCA空間に投影する方法は?
主成分分析(PCA)を実行した後、新しいベクトルをPCA空間に投影します(つまり、PCA座標系で座標を見つけます)。 を使用してR言語でPCAを計算しましたprcomp。これで、ベクトルにPCA回転行列を掛けることができるはずです。このマトリックスの主成分を行または列に配置する必要がありますか?
21 r  pca  r  variance  heteroscedasticity  misspecification  distributions  time-series  data-visualization  modeling  histogram  kolmogorov-smirnov  negative-binomial  likelihood-ratio  econometrics  panel-data  categorical-data  scales  survey  distributions  pdf  histogram  correlation  algorithms  r  gpu  parallel-computing  approximation  mean  median  references  sample-size  normality-assumption  central-limit-theorem  rule-of-thumb  confidence-interval  estimation  mixed-model  psychometrics  random-effects-model  hypothesis-testing  sample-size  dataset  large-data  regression  standard-deviation  variance  approximation  hypothesis-testing  variance  central-limit-theorem  kernel-trick  kernel-smoothing  error  sampling  hypothesis-testing  normality-assumption  philosophical  confidence-interval  modeling  model-selection  experiment-design  hypothesis-testing  statistical-significance  power  asymptotics  information-retrieval  anova  multiple-comparisons  ancova  classification  clustering  factor-analysis  psychometrics  r  sampling  expectation-maximization  markov-process  r  data-visualization  correlation  regression  statistical-significance  degrees-of-freedom  experiment-design  r  regression  curve-fitting  change-point  loess  machine-learning  classification  self-study  monte-carlo  markov-process  references  mathematical-statistics  data-visualization  python  cart  boosting  regression  classification  robust  cart  survey  binomial  psychometrics  likert  psychology  asymptotics  multinomial 

1
変数内の分散とペアワイズ距離の間のリンク
、我々は2つの変数を(同じサンプルサイズ)があればということを証明してくださいとと分散でよりも大きい、その後、差の2乗和内のデータポイント間の(ユークリッド距離の二乗すなわち)もより大きく、内のそれ。Y X YXXXYYYXXXYYYYXXXYYY

4
エッジケースの精度と再現率の正しい値は何ですか?
精度は次のように定義されます: p = true positives / (true positives + false positives) それは、それを修正しているtrue positivesとfalse positives、精度が1に近づくアプローチ0? リコールに関する同じ質問: r = true positives / (true positives + false negatives) 現在、これらの値を計算する必要がある統計テストを実装していますが、分母が0である場合があり、この場合にどの値を返すのか迷っています。 PS:不適切なタグをすみません、、およびを使用したいのですがrecall、新しいタグをまだ作成できません。precisionlimit
20 precision-recall  data-visualization  logarithm  references  r  networks  data-visualization  standard-deviation  probability  binomial  negative-binomial  r  categorical-data  aggregation  plyr  survival  python  regression  r  t-test  bayesian  logistic  data-transformation  confidence-interval  t-test  interpretation  distributions  data-visualization  pca  genetics  r  finance  maximum  probability  standard-deviation  probability  r  information-theory  references  computational-statistics  computing  references  engineering-statistics  t-test  hypothesis-testing  independence  definition  r  censoring  negative-binomial  poisson-distribution  variance  mixed-model  correlation  intraclass-correlation  aggregation  interpretation  effect-size  hypothesis-testing  goodness-of-fit  normality-assumption  small-sample  distributions  regression  normality-assumption  t-test  anova  confidence-interval  z-statistic  finance  hypothesis-testing  mean  model-selection  information-geometry  bayesian  frequentist  terminology  type-i-and-ii-errors  cross-validation  smoothing  splines  data-transformation  normality-assumption  variance-stabilizing  r  spss  stata  python  correlation  logistic  logit  link-function  regression  predictor  pca  factor-analysis  r  bayesian  maximum-likelihood  mcmc  conditional-probability  statistical-significance  chi-squared  proportion  estimation  error  shrinkage  application  steins-phenomenon 

1
分散の反意語
「分散の逆数」を意味する言葉はありますか?つまり、分散が大きい場合、は低くなりますか?近い反意語(「同意」や「類似性」など)には興味がありませんが、具体的には意味しますか?バツバツXバツバツX……\dots1 / σ21/σ21/\sigma^2

8
なぜ分散は、互いに続くすべての値の差として定義されないのですか?
これは多くの人にとって簡単な質問かもしれませんが、ここにあります: なぜ分散は、値の平均との差ではなく、互いに続くすべての値の差として定義されないのですか? これは私にとってより論理的な選択です。私は明らかにいくつかの欠点を監督していると思います。ありがとう 編集: 可能な限り明確に言い替えさせてください。これは私が意味するものです: 順序付けられた番号の範囲があると仮定します:1,2,3,4,5 (平均を使用せずに)値の間の(絶対)差を計算し、合計します(連続的に、ペアごとではなく、次の値ごとに)。 差異の数で除算する (フォローアップ:番号が順序付けられていない場合、答えは異なりますか?) ->分散の標準式と比較して、このアプローチの欠点は何ですか?
19 variance 

3
非正規サンプルのサンプル分散の漸近分布
これはこの質問によって提起された問題のより一般的な取り扱いです 。サンプル分散の漸近分布を導出した後、デルタ法を適用して標準偏差の対応する分布に到達できます。 iidの非正規ランダム変数のサイズのサンプル、平均してと分散。サンプル平均とサンプル分散を { X i } 、nnn{Xi},i=1,...,n{Xi},i=1,...,n\{X_i\},\;\; i=1,...,nμμ\muσ2σ2\sigma^2x¯=1n∑i=1nXi,s2=1n−1∑i=1n(Xi−x¯)2x¯=1n∑i=1nXi,s2=1n−1∑i=1n(Xi−x¯)2\bar x = \frac 1n \sum_{i=1}^nX_i,\;\;\; s^2 = \frac 1{n-1} \sum_{i=1}^n(X_i-\bar x)^2 私たちは知っている E(s2)=σ2,Var(s2)=1n(μ4−n−3n−1σ4)E(s2)=σ2,Var⁡(s2)=1n(μ4−n−3n−1σ4)E(s^2) = \sigma^2, \;\;\; \operatorname {Var}(s^2) = \frac{1}{n} \left(\mu_4 - \frac{n-3}{n-1}\sigma^4\right) ここで、であり、存在が有限である必要があるモーメントが存在し、有限である分布に注意を制限します。μ4=E(Xi−μ)4μ4=E(Xi−μ)4\mu_4 = E(X_i -\mu)^4 それを保持していますか n−−√(s2−σ2)→dN(0,μ4−σ4)?n(s2−σ2)→dN(0,μ4−σ4)?\sqrt n(s^2 - \sigma^2) \rightarrow_d N\left(0,\mu_4 - \sigma^4\right)\;\; ?

2
分散に関する回帰はなぜですか?
私はこのメモを読んでいます。 2ページに、次のように記載されています。 「データの分散は、特定の回帰モデルによってどの程度説明されますか?」 「回帰の解釈は係数の平均に関するものであり、推論はそれらの分散に関するものです。」 私はそのような声明について何度も読みましたが、なぜ「データの分散が与えられた回帰モデルによってどれほど説明されるのか」を気にするのはなぜでしょうか...より具体的には、なぜ「分散」なのでしょうか?

6
最小二乗推定量の分散における項の直感的な説明
がフルランクの場合、逆数が存在し、最小二乗推定値を取得します。 およびX T X β = (X T X )- 1 X Y ヴァー(β)= σ 2(X T X )- 1XXXXTXXTXX^TXβ^=(XTX)−1XYβ^=(XTX)−1XY\hat\beta = (X^TX)^{-1}XYVar(β^)=σ2(XTX)−1Var⁡(β^)=σ2(XTX)−1\operatorname{Var}(\hat\beta) = \sigma^2(X^TX)^{-1} 分散式でをどのように直感的に説明できますか?派生のテクニックは私にとって明らかです。(XTX)−1(XTX)−1(X^TX)^{-1}

5
直観(幾何学的またはその他)
分散の基本的なアイデンティティを考えてみましょう: Var(X)===E[(X−E[X])2]...E[X2]−(E[X])2Var(X)=E[(X−E[X])2]=...=E[X2]−(E[X])2 \begin{eqnarray} Var(X) &=& E[(X - E[X])^2]\\ &=& ...\\ &=& E[X^2] - (E[X])^2 \end{eqnarray} これは、中心モーメントを非中心モーメントに定義する単純な代数的操作です。 他のコンテキストでを簡単に操作できます。また、最初に平均を計算し、次に分散を計算するために、2回のパスではなく、データの1回のパスで分散を計算できます。Var(X)Var(X)Var(X) しかし、それはどういう意味ですか?平均についての広がりを0についての広がりに関連付ける直接的な幾何学的直観はありませんは1次元の集合であるため、平均の周りの広がりを、原点の広がりと正方形の平方との差としてどのように見ますか平均?XXX このアイデンティティへの洞察を与える良い線形代数解釈または物理的解釈または他のものはありますか?

4
分散は標準偏差よりも基本的な概念ですか?
で、このpsychometricsのウェブサイト私はそれを読んで [A] ta深いレベルの分散は、標準偏差よりも基本的な概念です。 このサイトでは、分散が標準偏差よりも基本的である理由を実際に詳しく説明していませんが、このサイトで似たようなことを読んだことを思い出しました。 たとえば、このコメントで @ kjetil-b-halvorsenは「標準偏差は解釈、報告に適しています。理論を発展させるには分散が優れている」と書いています。 これらの主張は関連しているように感じますが、実際には理解していません。サンプル分散の平方根は母標準偏差の不偏推定量ではないことを理解していますが、確かにそれ以上のものがあるはずです。 「基本」という用語は、このサイトでは曖昧すぎるかもしれません。その場合、おそらく、統計理論を開発する観点から、分散が標準偏差よりも重要であるかどうかを質問するという私の質問を実用化することができます。なぜ/なぜないのか?

3
ゼロ以外の漸近的分散を持つ漸近的整合性-それは何を表していますか?
この問題は以前に発生しましたが、それを明確にする(そして分類する)答えを引き出すことを試みる特定の質問をしたいと思います。 「Poor Man's Asymptotics」では、 (a)確率が定数に収束する一連のランダム変数 対照的に (b)確率が確率変数に収束する(したがって分布する)確率変数のシーケンス。 しかし、「賢者の漸近」では、次の場合もあります。 (c)限界で非ゼロの分散を維持しながら、確率が定数に収束するランダム変数のシーケンス。 私の質問は次のとおりです(以下の自分の探索的回答から盗みます): どのように我々は漸近的に一致しているが、推定理解することができますまた、非ゼロ、有限の分散を持っているの?この差異は何を反映していますか?その動作は、「通常の」一貫した推定量とどのように異なりますか? (c)で説明されている現象に関連するスレッド(コメントも参照): 一貫性のある推定量と公平な推定量の違いは何ですか? /stats/120553/convergence-of-an-estimator-with-infinite-variance 漸近的に整合性のある推定器が無限大でゼロ分散を持たないのはなぜですか? 収束と制限分散がほぼ確実にゼロになる

2
線形回帰にバイアス分散トレードオフのグラフィカルな表現はありますか?
私は停電に苦しんでいます。線形回帰のコンテキストでのバイアスと分散のトレードオフを示すために、次の図を紹介しました。 2つのモデルのいずれも適切ではないことがわかります。「単純」はXY関係の複雑さを認識しておらず、「複雑」は過剰適合であり、基本的にトレーニングデータを暗記しています。しかし、私はこれらの2つの写真の偏りと分散を完全に見ることができません。誰かがこれを見せてもらえますか? PS:バイアスと分散のトレードオフの直感的な説明に対する答えは?本当に助けにならなかったので、誰かが上の写真に基づいて異なるアプローチを提供できたらうれしいです。

2
混合効果モデルにおける説明された分散の割合
これが以前に尋ねられたかどうかはわかりませんが、それについては何も見つかりません。私の質問は、混合効果モデルの固定因子とランダム因子のそれぞれによって説明される分散の割合を取得する方法を学ぶための良い参考資料を提供できるかどうかです。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.