7 平均を「ベース」ポイントとして使用せずに分散を計算できますか? mathematical-statistics variance mean median scale-estimator — 意志 ソース 3 与えられた E(バツ2)< ∞E(X2)<∞、分散は次で与えられます σ2= E((X− E(X))2)σ2=E((X−E(X))2)定義により。フォーミュラは、σ2= E(バツ2)− E(X)2σ2=E(X2)−E(X)2。つまり、必要な分散のためにE(X)E(X)。もちろん、他の統計を使用して独自の分散測度を定義することもできます...または回答から1つを使用することもできます。 — BloXX 5 短い答え:変動性(分散、広がり、スケール)を要約する他の多くの方法がありますが、他のどれも分散ではありません。(実際、分散は平均を参照せずに定義できます。) — Nick Cox 3 はい:与えられたデータ バツ、X, の共分散を計算する (X、X)(X,X)stats.stackexchange.com/a/18200/919で説明されているように。このメソッドは、平均を計算することはありません。 — whuber
12 絶対偏差の中央値は次のように定義されます MAD (X)= 中央値| バツ− 中央値(X)|MAD(X)=median|X−median(X)| そして、標準偏差の代替と見なされます。しかし、これは差異ではありません。特に、それは常に存在しますバツX瞬間を可能にします。たとえば、標準コーシーのMADは1に等しくなります。 P( | X− 0 | < 1 )0は中央値です= アークタン(1 )/ π− アークタン(− 1 )/ π=12P(|X−0|<1)⏟0 is the median=arctan(1)/π−arctan(−1)/π=12 — 西安 ソース 7 このアイデアの初心者は、平均からの平均絶対偏差(しばしば平均偏差)と平均からの中央絶対偏差にも注意する必要があります。中央値からの絶対偏差の平均を思い出しませんが、例を示します。残念ながら、略語MADはさまざまに適用されているため、最初に人々のコードを信頼し、次に代数的または言語的な定義を信頼しますが、略語MADの使用はまったくありません。対称分布およびその他の分布では、ここで定義されているMADは四分位範囲の半分です。(MADに気を配るのは少し明白すぎると思います。) — Nick Cox 3 また、中央値絶対偏差関数のソフトウェア実装では、MAD値をこの回答で提示された形式から定数係数でスケーリングできるため、その値は正規分布の標準偏差と一致することに注意してください。 — EdM @EdM優れた点。個人的には、人々が別の用語を使用しない限り、その習慣は嫌いです。それはもはやMADではありません! — Nick Cox 1 @NickCox:中央値に集中することの魅力は、分布が平均を享受しているかどうかに関係なく、数量が常に存在することです。これはWikipediaにある定義です。 — 西安 MADは相互に破壊を保証 — kjetil b halvorsen
3 Math.stackexchangeには、この質問に対する解決策がすでにあります。 私は答えを要約します: あなたは分散が バツ2¯¯¯¯¯−バツ¯¯¯2x2¯−x¯2、これは1つのパスのみをとります(平均と二乗の平均を同時に計算します)が、分散が平均と比較して小さい場合、丸め誤差が発生しやすくなります。 二乗差分の合計はどうですか?確かに、直接計算で次のことを確認できます。 2vバツ=1n (n − 1 )Σ1 ≤ I < J ≤ n個(バツ私−バツj)2。2vバツ=1ん(ん−1)Σ1≤私<j≤ん(バツ私−バツj)2。 平均のない標本分散は、次のように計算されます。 vバツ=1n − 1⎡⎣Σi = 1んバツ2私−1ん(Σi = 1んバツ私)2⎤⎦vバツ=1ん−1[Σ私=1んバツ私2−1ん(Σ私=1んバツ私)2] — フェルディ ソース