タグ付けされた質問 「mean」

確率変数の期待値。または、サンプルの位置メジャー。

4
非正規分布の信頼区間を計算するにはどうすればよいですか?
いくつかの一般的な値に大きな偏りがある383個のサンプルがありますが、平均の95%CIをどのように計算しますか?私が計算したCIはかなり外れているように見えます。これは、ヒストグラムを作成するときにデータが曲線のように見えないためです。だから、ブートストラップのようなものを使用しなければならないと思いますが、これはあまりよくわかりません。

4
新しいベクターをPCA空間に投影する方法は?
主成分分析(PCA)を実行した後、新しいベクトルをPCA空間に投影します(つまり、PCA座標系で座標を見つけます)。 を使用してR言語でPCAを計算しましたprcomp。これで、ベクトルにPCA回転行列を掛けることができるはずです。このマトリックスの主成分を行または列に配置する必要がありますか?
21 r  pca  r  variance  heteroscedasticity  misspecification  distributions  time-series  data-visualization  modeling  histogram  kolmogorov-smirnov  negative-binomial  likelihood-ratio  econometrics  panel-data  categorical-data  scales  survey  distributions  pdf  histogram  correlation  algorithms  r  gpu  parallel-computing  approximation  mean  median  references  sample-size  normality-assumption  central-limit-theorem  rule-of-thumb  confidence-interval  estimation  mixed-model  psychometrics  random-effects-model  hypothesis-testing  sample-size  dataset  large-data  regression  standard-deviation  variance  approximation  hypothesis-testing  variance  central-limit-theorem  kernel-trick  kernel-smoothing  error  sampling  hypothesis-testing  normality-assumption  philosophical  confidence-interval  modeling  model-selection  experiment-design  hypothesis-testing  statistical-significance  power  asymptotics  information-retrieval  anova  multiple-comparisons  ancova  classification  clustering  factor-analysis  psychometrics  r  sampling  expectation-maximization  markov-process  r  data-visualization  correlation  regression  statistical-significance  degrees-of-freedom  experiment-design  r  regression  curve-fitting  change-point  loess  machine-learning  classification  self-study  monte-carlo  markov-process  references  mathematical-statistics  data-visualization  python  cart  boosting  regression  classification  robust  cart  survey  binomial  psychometrics  likert  psychology  asymptotics  multinomial 

6
「平均」の一般化のために、中央値は平均の一種ですか?
「平均」の概念は、従来の算術平均よりもはるかに広く歩き回ります。中央値を含むまで伸びますか?類推により、 raw data⟶idraw data⟶meanraw mean⟶id−1arithmetic meanraw data⟶recipreciprocals⟶meanmean reciprocal⟶recip−1harmonic meanraw data⟶loglogs⟶meanmean log⟶log−1geometric meanraw data⟶squaresquares⟶meanmean square⟶square−1root mean squareraw data⟶rankranks⟶meanmean rank⟶rank−1medianraw data⟶idraw data⟶meanraw mean⟶id−1arithmetic meanraw data⟶recipreciprocals⟶meanmean reciprocal⟶recip−1harmonic meanraw data⟶loglogs⟶meanmean log⟶log−1geometric meanraw data⟶squaresquares⟶meanmean square⟶square−1root mean squareraw data⟶rankranks⟶meanmean rank⟶rank−1median \text{raw data} \overset{\text{id}}{\longrightarrow} \text{raw data} \overset{\text{mean}}{\longrightarrow} \text{raw mean} \overset{\text{id}^{-1}}{\longrightarrow} \text{arithmetic mean} \\ \text{raw data} \overset{\text{recip}}{\longrightarrow} \text{reciprocals} …
20 mean  average  median 

4
順序変数の平均を計算する
多くの場所で、順序変数の平均を計算することは不適切であると読んでいます。なぜそれが不適切なのか、直観を得ようとしています。一般に、順序変数は正規分布していないため、平均を計算すると不正確な表現になるためだと思います。順序変数の平均を計算するのが不適切である理由について、より詳細な理由を誰かに教えてもらえますか?

4
相関値の平均化
さまざまな実験条件下Yで変数が変数にどのように依存するかをテストしX、次のグラフを取得するとします。 上記のグラフの破線は、各データ系列の線形回帰を示し(実験設定)、凡例の数字は各データ系列のピアソン相関を示します。 私は間を「平均相関」(または「平均相関を」)を計算したいXとY。r値を単純に平均してもいいですか?「平均判定基準」どうですか?平均を計算し、その値の2乗を取るか、個々のR 2の平均を計算する必要がありますか?R2R2R^2rR2R2R^2

4
エッジケースの精度と再現率の正しい値は何ですか?
精度は次のように定義されます: p = true positives / (true positives + false positives) それは、それを修正しているtrue positivesとfalse positives、精度が1に近づくアプローチ0? リコールに関する同じ質問: r = true positives / (true positives + false negatives) 現在、これらの値を計算する必要がある統計テストを実装していますが、分母が0である場合があり、この場合にどの値を返すのか迷っています。 PS:不適切なタグをすみません、、およびを使用したいのですがrecall、新しいタグをまだ作成できません。precisionlimit
20 precision-recall  data-visualization  logarithm  references  r  networks  data-visualization  standard-deviation  probability  binomial  negative-binomial  r  categorical-data  aggregation  plyr  survival  python  regression  r  t-test  bayesian  logistic  data-transformation  confidence-interval  t-test  interpretation  distributions  data-visualization  pca  genetics  r  finance  maximum  probability  standard-deviation  probability  r  information-theory  references  computational-statistics  computing  references  engineering-statistics  t-test  hypothesis-testing  independence  definition  r  censoring  negative-binomial  poisson-distribution  variance  mixed-model  correlation  intraclass-correlation  aggregation  interpretation  effect-size  hypothesis-testing  goodness-of-fit  normality-assumption  small-sample  distributions  regression  normality-assumption  t-test  anova  confidence-interval  z-statistic  finance  hypothesis-testing  mean  model-selection  information-geometry  bayesian  frequentist  terminology  type-i-and-ii-errors  cross-validation  smoothing  splines  data-transformation  normality-assumption  variance-stabilizing  r  spss  stata  python  correlation  logistic  logit  link-function  regression  predictor  pca  factor-analysis  r  bayesian  maximum-likelihood  mcmc  conditional-probability  statistical-significance  chi-squared  proportion  estimation  error  shrinkage  application  steins-phenomenon 

2
MAEを最小化すると、平均ではなく中央値が予測されるのはなぜですか?
予測:原則と実践は、ロブ・J HyndmanとジョージAthanasopoulos教科書、特に精度測定上のセクション: MAEを最小化する予測方法は中央値の予測につながり、RMSEを最小化すると平均の予測につながります MAEを最小化すると平均ではなく中央値が予測される理由を直感的に説明できますか?そして、これは実際には何を意味しますか? お客様に、「平均予測をより正確にする、または非常に不正確な予測を避けるために、あなたにとってより重要なことは何ですか?」と尋ねました。彼は、平均予報をより正確にするために、より高い優先度を持っていると言いました。したがって、この場合、MAEまたはRMSEを使用する必要がありますか?この引用を読む前に、私はMAEがそのような状態に良くなると信じていました。そして今、私は疑います。
19 forecasting  mean  median  rms  mae 

4
平均=中央値は、単峰分布が対称であることを意味しますか?
単峰性分布の場合、平均=中央値であれば、分布は対称であると言えば十分ですか? ウィキペディアは、平均と中央値の関係で次のように述べています。 「分布が対称の場合、平均は中央値に等しく、分布の歪度はゼロになります。さらに、分布が単峰性の場合、平均=中央値=モードです。これは、コイントスまたはシリーズ1、2、3、4、...ただし、一般的に逆は成り立たないことに注意してください。つまり、歪度ゼロは、平均が中央値に等しいことを意味しません。」 ただし、必要な情報を収集することは(私にとって)それほど単純ではありません。助けてください。

4
プラス1標準偏差が最大値を超えることを意味できますか?
最小0と最大94.33のサンプルの平均74.10と標準偏差33.44があります。 私の教授は、平均プラス1つの標準偏差が最大値を超える方法を尋ねます。 私は彼女にこれについて多くの例を示しましたが、彼女は理解していません。私は彼女を示すためにいくつかの参照が必要です。これについては特に統計書のどの章や段落でもかまいません。

3
中心極限定理に大きなサンプルサイズが必要な分布の例
一部の書籍では、中心極限定理が適切に近似するために、サイズ30以上のサンプルサイズが必要であると述べてい。 X¯X¯\bar{X} これはすべてのディストリビューションに十分ではないことを知っています。 サンプルサイズが大きい場合(おそらく100、1000、またはそれ以上)でも、サンプル平均の分布がかなり歪んでいる分布の例をいくつか見たいと思います。 私は以前にそのような例を見たことがあることを知っていますが、どこにあるか思い出せず、見つけることができません。

3
対数正規データセットの平均の信頼区間を計算するにはどうすればよいですか?
いくつかの場所で、各サンプルの対数を取り、変換されたデータの信頼区間を計算し、逆演算を使用して信頼区間を元に戻すことにより、データセットを正規分布のものに変換できることを聞きました(たとえば、場合は、それぞれ下限と上限の10の累乗になり)。ログ10ログ10\log_{10} ただし、単に平均自体に対して機能しないという理由だけで、このメソッドには少し疑いがあります10平均(ログ10(X))≠ 平均(X)10平均⁡(ログ10⁡(バツ))≠平均⁡(バツ)10^{\operatorname{mean}(\log_{10}(X))} \ne \operatorname{mean}(X) これを行う正しい方法は何ですか?平均自体で機能しない場合、平均の信頼区間でどのように機能しますか?

4
相関の非推移性:性別と脳の大きさの間、および脳の大きさとIQの間の相関関係、性別とIQの間の相関関係はない
ブログで次の説明を見つけましたが、相関関係の非推移性に関する詳細情報を取得したいと思います。 次の議論の余地のない事実があります。 平均して、男性と女性の間で脳容積に違いがあります IQと脳の大きさの間には相関関係があります。相関は0.33であるため、IQの変動の10%に相当します これらの前提1と2から、論理的には次のように思われる:平均して女性は男性よりも低いIQを持っている。しかし、それは誤りです!統計では、相関関係は推移的ではありません。証拠は、IQテストの結果を見るだけでよく、男性と女性のIQが平均して変わらないことを示しています。 この相関関係の非推移性をもう少し深く理解したいと思います。 IQと脳の大きさの相関関係が0.9だった場合(これは(1)ではないことを知っています)、男性よりも平均して女性のIQが低いと推測することはまだ誤解でしょうか? どうか、IQ(およびテストの限界)、性差別、女性のステレオタイプ、慢などについて話をするためにここにいるのではありません(2)。誤justの背後にある論理的な理由を理解したいだけです。 (1)ネアンデルタール人の頭脳はホモサピエンスよりも大きかったが、賢くはなかった。 (2)私は女性であり、全体として、自分自身や他の女性の方が男性よりも賢くないと考えています。IQテストは気にしません。知的能力。 フランス語の元のソース: les faits indiscutables suivantsについて: il ya unedifférencede volumecérébralen moyenne entre hommes et femmes QIとボリューム・セレブラル全体の相関関係。相関係数0.33以下、10%の変動係数に対応 1回目と2回目はsembledécoulerlogiquement que:les femmes ont en moyenne un QIinférieuraux hommes。 Mais c'est une erreur de raisonnement!統計上、相関関係は一時的なものではありません。La preuve、c'est que pour en avoir lecœurnet、il suffit de relever les …

4
平均および中央値のプロパティ
誰かが2つのステートメント(a)と(b)をリンクする数学的論理を明確に説明してもらえますか?値のセット(分布)があります。さて、 a)中央値はすべての値に依存するわけではありません[1つまたは2つの中間値に依存するだけです]。b)中央値は、そこからの絶対偏差の最小値の軌跡です。 同様に、対照的に、 a)(算術)平均はすべての値に依存します。b)平均は、それからの最小二乗偏差の軌跡です。 私の把握はこれまでのところ直感的です。

6
MLEが平均のバイアス推定値を生成する例はありますか?
偏った平均のMLE推定量の例を提供できますか? 規則性の条件に違反することでMLE推定量を一般的に破る例は探していません。 私がインターネットで見ることができるすべての例は分散を参照します、そして、私は平均に関連する何かを見つけることができないようです。 編集 @MichaelHardyは、特定の提案モデルでMLEを使用して均一分布の平均のバイアス推定値を取得する例を提供しました。 しかしながら https://en.wikipedia.org/wiki/Uniform_distribution_(continuous)#Estimation_of_midpoint MLEは、明らかに別の提案モデルの下で、平均の一様に最小の不偏推定量であることを示唆しています。 この時点で、モデル中立であるサンプル平均推定量とは対照的に、非常に仮説的なモデル依存である場合、MLE推定が何を意味するのかはまだ明確ではありません。最後に、母集団について何かを推定することに興味があり、仮説モデルのパラメーターの推定についてはあまり気にしません。 編集2 @ChristophHanckが追加情報でモデルを示したため、バイアスが導入されましたが、MSEを減らすことができませんでした。 また、追加の結果があります。 http://www.maths.manchester.ac.uk/~peterf/CSI_ch4_part1.pdf(p61) http://www.cs.tut.fi/~hehu/SSP/lecture6.pdf(スライド2) http:/ /www.stats.ox.ac.uk/~marchini/bs2a/lecture4_4up.pdf(スライド5) 「θの最も効率的な不偏推定量ˆθが存在する場合(すなわちˆθが不偏であり、その分散がCRLBに等しい場合)、推定の最尤法はそれを生成します。」 「さらに、効率的な推定量が存在する場合、それはML推定量です。」 自由なモデルパラメーターをもつMLEは偏りがなく効率的であるため、定義上、この "the"最尤推定量は? 編集3 @AlecosPapadopoulosの数学フォーラムには、半正規分布の例があります。 /math/799954/can-the-maximum-likelihood-estimator-be-unbiased-and-fail-to-achieve-cramer-rao 均一な場合のように、そのパラメーターを固定していません。彼は平均推定量のバイアスを実証していませんが、それで解決すると言うでしょう。

2
どのような(対称)分布について、サンプルはサンプル中央値よりも効率的な推定量を意味しますか?
サンプルの中央値は、外れ値を無視するため、サンプル平均よりも中心傾向のより堅牢な尺度であるという信念のもとで努力しました。したがって、(別の質問への回答で)正規分布から引き出されたサンプルの場合、サンプル平均の分散がサンプル中央値の分散よりも小さいこと(少なくともが大きい)を知って驚いた。nnn 私は数学的にこれが本当である理由を理解しています。他の分布の平均ではなく、中央値をいつ使用するかについての直感に役立つ「哲学的」な見方はありますか? 特定の分布に関する質問にすばやく答えるのに役立つ数学的なツールはありますか?

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.