タグ付けされた質問 「standard-deviation」

標準偏差は、確率変数の分散の平方根、その推定量、またはデータのバッチの広がりの同様の尺度です。

5
標準偏差の2Dアナログ?
次の実験を考えてみましょう。人々のグループに都市のリストが与えられ、世界の(ラベル付けされていない)地図上の対応する場所をマークするように求められます。各都市について、それぞれの都市のほぼ中心にある点の散布図を取得します。イスタンブールなどの一部の都市は、他の都市よりも散乱が少ないとモスクワは言います。 与えられた都市について、testによって割り当てられたマップ上の都市の位置(ローカル座標系など)を表す2Dサンプルのセットを取得すると仮定しましょう件名。このセットのポイントの「分散」の量を、適切な単位(km)の単一の数値として表現したいと思います。{(xi,yi)}{(xi,yi)}\{(x_i, y_i)\}(x,y)(x,y)(x, y)iii 1D問題の場合、標準偏差を選択しますが、上記のような状況に対して合理的に選択できる2Dアナログはありますか?

4
分散は標準偏差よりも基本的な概念ですか?
で、このpsychometricsのウェブサイト私はそれを読んで [A] ta深いレベルの分散は、標準偏差よりも基本的な概念です。 このサイトでは、分散が標準偏差よりも基本的である理由を実際に詳しく説明していませんが、このサイトで似たようなことを読んだことを思い出しました。 たとえば、このコメントで @ kjetil-b-halvorsenは「標準偏差は解釈、報告に適しています。理論を発展させるには分散が優れている」と書いています。 これらの主張は関連しているように感じますが、実際には理解していません。サンプル分散の平方根は母標準偏差の不偏推定量ではないことを理解していますが、確かにそれ以上のものがあるはずです。 「基本」という用語は、このサイトでは曖昧すぎるかもしれません。その場合、おそらく、統計理論を開発する観点から、分散が標準偏差よりも重要であるかどうかを質問するという私の質問を実用化することができます。なぜ/なぜないのか?

1
外れ値を明らかにするために、1つの平均値と標準偏差を残して使用できますか?
データを正常に配信したとします。データの各要素について、平均からどれだけのSDが離れているかを確認します。データに外れ値がある可能性があります(おそらく1つだけですが、2つまたは3つかもしれません)が、この外れ値は基本的に私が探しているものです。平均とSDの計算から現在見ている要素を一時的に除外することは意味がありますか?私の考えでは、平均に近い場合、影響はありません。外れ値である場合、平均とSDの計算にバイアスがかかり、検出される確率が低くなる可能性があります。私は統計学者ではないので、どんな助けでも大歓迎です!

3
有界データセットの変動係数の最大値
標準偏差が平均を超えることができるかどうかに関する最近の質問に続く議論では、1つの質問が簡潔に提起されましたが、完全に回答されませんでした。だから私はここでそれを求めています。 非負数セットを考えます。 ここで、です。が別個である必要はありません。つまり、セットがマルチセットである可能性があります。セットの平均と分散は、として定義され および標準偏差はです。数値のセットは母集団からのサンプルではなく、母平均または母分散を推定していないことに注意してください。質問は次のとおりです。nnnxixix_i0≤xi≤c0≤xi≤c0 \leq x_i \leq c1≤i≤n1≤i≤n1 \leq i \leq nxixix_ix¯=1n∑i=1nxi, σ2x=1n∑i=1n(xi−x¯)2=(1n∑i=1nx2i)−x¯2x¯=1n∑i=1nxi, σx2=1n∑i=1n(xi−x¯)2=(1n∑i=1nxi2)−x¯2\bar{x} = \frac{1}{n}\sum_{i=1}^n x_i, ~~ \sigma_x^2 = \frac{1}{n}\sum_{i=1}^n (x_i - \bar{x})^2 = \left(\frac{1}{n}\sum_{i=1}^n x_i^2\right) - \bar{x}^2σxσx\sigma_x 区間ののすべての選択に対する、変動係数の最大値は何ですか?σxx¯σxx¯\dfrac{\sigma_x}{\bar{x}}xixix_i[0,c][0,c][0,c] の最大値は これは、の値がで、残りの(外れ値)値 が値、 しかし、これはにまったく依存せず、おそらくnとcの両方に依存する大きな値を達成できるかどうか疑問に思っています。σxx¯σxx¯\frac{\sigma_x}{\bar{x}}n−1−−−−−√n−1\sqrt{n-1}n−1n−1n-1xixix_i000xixix_icccx¯=cn, 1n∑x2i=c2n⇒σx=c2n−c2n2−−−−−−−√=cnn−1−−−−−√.x¯=cn, 1n∑xi2=c2n⇒σx=c2n−c2n2=cnn−1.\bar{x} = \frac{c}{n},~~ \frac{1}{n}\sum x_i^2 = \frac{c^2}{n} \Rightarrow \sigma_x = \sqrt{\frac{c^2}{n} - \frac{c^2}{n^2}} = \frac{c}{n}\sqrt{n-1}.cccnnnccc …

2
なぜ「標準」偏差と呼ばれるのですか?
私は簡単な、そしておそらく些細な質問を持っています:なぜ標準偏差はそれだけで「標準」と呼ばれるのですか?それは、分散に関してデータセットと結果の比較を標準化するためですか? Stack Exchangeでの検索ではこの質問が見つかりませんし、用語の語源での Google検索でも多くの価値がありません。

2
標準偏差の閉じた形の不偏推定量はどの分布にありますか?
正規分布の場合、標準偏差の不偏推定量があります: σ^unbiased=Γ(n−12)Γ(n2)12∑k=1n(xi−x¯)2−−−−−−−−−−−−√σ^不偏=Γ(n−12)Γ(n2)12∑k=1n(xi−x¯)2\hat{\sigma}_\text{unbiased} = \frac{\Gamma(\frac{n-1}{2})}{\Gamma(\frac{n}{2})} \sqrt{\frac{1}{2}\sum_{k=1}^n(x_i-\bar{x})^2} この結果があまり知られていない理由は、それが大部分の重要な輸入の問題ではなくむしろ骨cur品であるように思われます。証明はこのスレッドでカバーされています。正規分布の重要な特性を利用します。 1σ2∑k=1n(xi−x¯)2∼χ2n−11σ2∑k=1n(xi−x¯)2∼χn−12 \frac{1}{\sigma^2} \sum_{k=1}^n(x_i-\bar{x})^2 \sim \chi^{2}_{n-1} そこから、少しの作業で、、およびこの回答を倍数として識別することにより、の結果を推測でき。σ σ公平E(∑nk=1(xi−x¯)2−−−−−−−−−−−−√)E(∑k=1n(xi−x¯)2)\mathbb{E}\left( \sqrt{\sum_{k=1}^n(x_i-\bar{x})^2} \right)σσ\sigmaσ^unbiasedσ^unbiased\hat{\sigma}_\text{unbiased} これにより、他のどの分布が標準偏差の閉形式の不偏推定量を持っているのか興味があります。分散の不偏推定量とは異なり、これは明らかに分布固有です。さらに、他の分布の推定量を見つけるために証明を適応させるのは簡単ではありません。 スキュー正規分布には、2次形式の優れた分布特性がいくつかあります。これは、使用した正規分布特性が事実上特別なケースです(正規分布は特殊なタイプのスキュー正規分布なので)。このメソッドをそれらに拡張します。しかし、他のディストリビューションでは、まったく異なるアプローチが必要と思われます。 そのような推定量が知られている他の分布はありますか?

2
標準偏差がNの平方和のsqrtとしてではなく、分散のsqrtとして定義されるのはなぜですか?
今日、私は統計の入門クラスを教え、学生が質問を思いついた。ここで、「なぜ標準偏差はN上の平方和の平方ではなく分散の平方として定義されるのか」と言い換える。 母分散を定義します:σ2=1N∑(xi−μ)2σ2=1N∑(xi−μ)2\sigma^2=\frac{1}{N}\sum{(x_i-\mu)^2} 標準偏差:。σ=σ2−−√=1N√∑(xi−μ)2−−−−−−−−−−√σ=σ2=1N∑(xi−μ)2\sigma=\sqrt{\sigma^2}=\frac{1}{\sqrt{N}}\sqrt{\sum{(x_i-\mu)^2}} 与えられる解釈は、母平均から母集団の単位の平均偏差を与えるということです。σσ\sigmaXXX ただし、sdの定義では、平方和のを除算します。学生が提起する問題は、なぜ二乗和の面積をで割らないのかということです。したがって、競合する式になります:学生は、この式はように除算する場合よりも、平均からの「平均」偏差のように見えると主張しました。N−−√N\sqrt{N}NNNσnew=1N∑(xi−μ)2−−−−−−−−−−√.σnew=1N∑(xi−μ)2.\sigma_{new}=\frac{1}{N}\sqrt{\sum{(x_i-\mu)^2}}.N−−√N\sqrt{N}σσ\sigma この質問は愚かではないと思いました。私は、sdが平均平方偏差である分散のsqrtとして定義されていると言うよりも先に進む学生に答えたいと思います。別の言い方をすれば、なぜ生徒は正しい式を使用し、自分の考えに従わないのですか? この質問は、ここで提供される古いスレッドと回答に関連しています。答えは3つの方向にあります。 σσ\sigmaは二乗平均平方根(RMS)偏差であり、平均からの「典型的な」偏差ではありません(つまり、)。したがって、定義が異なります。σnewσnew\sigma_{new} 数学的な特性があります。 さらに、sqrtは「ユニット」を元のスケールに戻します。ただし、これは場合でもあり、代わりにで除算されます。σnewσnew\sigma_{new}NNN ポイント1と2の両方は、RMSとしてsdを支持する引数ですが、使用に反対する引数はません。入門レベルの学生に平均からの平均RMS距離使用を説得する良い議論は何でしょうか?σnewσnew\sigma_{new}σσ\sigma

3
データセットの変更後の古い標準偏差を使用した新しい標準偏差の計算
平均と標準偏差を持つ実数値の配列があります。配列要素が別の要素置き換えられた場合、新しい平均はnnnμoldμold\mu_{old}σoldσold\sigma_{old}xixix_ixjxjx_j μnew=μold+xj−xinμnew=μold+xj−xin\mu_{new}=\mu_{old}+\frac{x_j-x_i}{n} このアプローチの利点は、の値に関係なく一定の計算が必要になることです。を使用した計算のように、を使用してを計算する方法はありますか?nnnσnewσnew\sigma_{new}σoldσold\sigma_{old}μnewμnew\mu_{new}μoldμold\mu_{old}

3
標準偏差ではなく分散を報告するのが適切なのはいつですか?
さまざまな分散コンポーネントをモデル化した分析を実施しました。結果を表で報告する場合、分散ではなく標準偏差を報告する方がはるかに簡潔です。 だから、これは私に質問をもたらします-標準偏差の代わりに分散を報告する理由はありますか?一方を他方に報告する方が適切ですか?

5
ペアの観測値の分散の比較
私がしている観測(ペア、有限の第一及び第二モーメントを有する共通の未知の分布から引き出された)を、平均の周りに対称です。NNNバツ私バツ私X_iY私Y私Y_i してみましょうの標準偏差(上の無条件の)、および Y.私のために同じことが仮説を検証したいと思います σバツσバツ\sigma_XバツバツXYYYσYσY\sigma_Y H0H0H_0:σバツ= σYσバツ=σY\sigma_X = \sigma_Y H1H1H_1:σバツ≠ σYσバツ≠σY\sigma_X \neq \sigma_Y 誰でもそのようなテストを知っていますか?最初の分析では、分布が正規であると仮定できますが、一般的なケースの方が興味深いです。閉じた形式のソリューションを探しています。ブートストラップは常に最後の手段です。

2
さまざまな分布の絶対偏差(MAD)およびSDの中央値
正規分布データの場合、標準偏差σσ\sigmaと絶対偏差中央値MADMAD\text{MAD}は次の関係にあります。 σ=Φ−1(3/4)⋅MAD≈1.4826⋅MAD,σ=Φ−1(3/4)⋅MAD≈1.4826⋅MAD,\sigma=\Phi^{-1}(3/4)\cdot \text{MAD}\approx1.4826\cdot\text{MAD}, ここで、Φ()Φ()\Phi()は標準正規分布の累積分布関数です。 他の分布にも同様の関係はありますか?

3
標準偏差を評価するにはどうすればよいですか?
特定のタスクを遂行する能力について、85人から回答を集めました。 応答は5ポイントのリッカートスケールです。 5 =非常に良い、4 =良い、3 =平均、2 =悪い、1 =非常に悪い、 平均スコアは2.8で、標準偏差は0.54です。 平均値と標準偏差の意味を理解しています。 私の質問は、この標準偏差はどれだけ良い(または悪い)かということです。 つまり、標準偏差の評価に役立つガイドラインはありますか。

4
1つの変数の標準偏差が0の場合、相関はどうなりますか?
私が理解しているように、方程式を使用して共分散を正規化することで相関を得ることができます ρi,j=cov(Xi,Xj)σiσjρi,j=cov(Xi,Xj)σiσj\rho_{i,j}=\frac{cov(X_i, X_j)}{\sigma_i \sigma_j} ここで、は標準偏差です。 XIσi=E[(Xi−μi)2]−−−−−−−−−−−√σi=E[(Xi−μi)2]\sigma_i=\sqrt{E[(X_i-\mu_i)^2]}XiXiX_i 私の懸念は、標準偏差がゼロに等しい場合です。ゼロにならないことを保証する条件はありますか? ありがとう。

9
非負データの標準偏差は平均を超えることができますか?
三角形の3Dメッシュがいくつかあります。三角形領域の統計は次のとおりです。 最小0.000 最大2341.141 平均56.317 標準開発98.720 では、数値が上記のように機能する場合、標準偏差に関して特に役立つ何かを意味するのか、それとも計算にバグがあることを示唆するのか?領域は確かに正規分布からはほど遠い。 また、以下の回答のいずれかで言及したように、数字が負になり、したがって法定範囲外になったのは平均から1 SDしかかからなかったことに本当に驚いたことです。 ありがとう

5
米国と英国の学校が標準偏差の異なる計算方法を教えるのはなぜですか?
私が理解しているように、英国の学校は標準偏差が以下を使用して発見されることを教えています: 一方、米国の学校は以下を教えています。 (とにかく基本的なレベルで)。 これは、インターネット上で検索したときに過去に多くの私の問題を引き起こしましたが、間違った説明を見つけました。 なぜ違いがあるのですか? 単純なデータセットで10個の値が指定されている場合、間違った方法が適用された場合(試験など)、どの程度のエラーが発生しますか?

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.