期待値は、非正規分布の平均値、中央値などとどのように関連していますか?


9

連続確率変数の期待値は、非正規分布(例:歪正規)の算術平均、中央値などとどのように関連していますか?一般的で興味深い分布(例えば、対数正規、単純なバイ/マルチモーダル分布、その他奇妙で素晴らしいもの)に興味があります。

私は主に定性的な回答を探していますが、定量的または定式的な回答も歓迎します。私は特にそれをより明確にする視覚的表現を見たいと思います。


少しわかりやすくなりますか?算術平均と中央値は、データに適用する関数であり、特定の分布に固有のものではありません...たとえば、サンプル平均を計算するためにデータが正規である必要はありません。
ゲスト

さて、問題は技術的には「期待値は特定の確率分布からランダムに抽出されたデータの平均値や中央値などどのように関連するのか」ということになるはずです。私は、分布がより歪んでいる場合、中央値と平均値がさらに離れており、中央値がデータの場所をより適切に示す可能性があると直観的に言うことができるのと同じように、単純で直感的な理解を求めています。
naught101

へえ。マルコに感謝します。私は明らかに間違ったことを読んでいます。それを答えとして書くこともできますが、私は彼のベストアンサーでそれを選びます。
naught101

回答:


8

(上記の私の削除済みコメントから部分的に変換されました)

期待値と算術平均はまったく同じものです。中央値は平均と重要な関係にありますが、それらの関係についていくつかのことが言えます。

  • 分布が対称である場合、平均と中央値は同じです

  • 分布が負に歪んでいる場合、中央値は通常平均よりも大きい

  • 分布が明確に歪んでいる場合、中央値は通常平均よりも小さい


面白い。平均が中央値よりも大きい、負に歪んだ分布の異常な動作の例は何ですか?
naught101 2012年

@ naught101:これはタイプミスですか?負に歪んだ分布は、中心の左側の結果が中心の右側の結果よりも頻繁に発生する分布であるため、低頻度の結果の「テール」が右側に出ます。そのような状況では、左側のこぶは常に(算術)平均を中心から左に引っ張るが、右側の尾は平均よりも大きい中央値を維持する。
Assad Ebrahim 2014年

@AssadEbrahim:いいえ、それはマクロのコメント「中央値は通常平均よりも大きい」への言及でした-私は反例を求めていました。
naught101 2014年

@ naught101:単峰分布の場合の反例は彼の次の行です:こぶが右にある場合、左の尾は中央値の下に中央値を引きます。テールが長いほど、中央値と平均値のギャップが大きくなります。
Assad Ebrahim 2014年

1
平均より中央値を使用する、またはその逆の実際的な状況は何ですか?たとえば、生存期間が指数分布に従う生存分析では、生/死をバイナリとして予測する必要がある場合、中央値(半分は長く続く、最後は半分が続く)または平均(「期待される」寿命)を使用する必要があります。結果?
drevicko

5

XLN(μ,σ2)

  • HM(X)=eμ12σ2
  • GM(X)=eμ
  • AM(X)=eμ+12σ2

調和平均と算術平均の積が幾何平均の2乗を生成することを確認することは難しくありません。つまり、

HM(X)AM(X)=GM2(X).

XXX

GM(X)=HM(X)AM(X).

さらに、よく知られているHM-GM-AM不等式

HM(X)GM(X)AM(X)

次のように表すことができます

HM(X)GVar(X)=GM(X)=AM(X)GVar(X),

GVar(X)=eσ2


1

完全を期すために、平均が十分に定義されていない分布もあります。古典的な例はコーシー分布です(この回答には理由がわかりやすく説明されています)。もう1つの重要な例は、指数が2未満のパレート分布です。


1
x=0

@カールの良い点-私はそれに応じて答えを編集しました。多くのthx(:
drevicko

0

数学的な平均値と期待値が同じように定義されていることは正しいですが、歪んだ分布の場合、この命名規則は誤解を招くようになります。

あなたは彼女の街の住宅価格について友達に聞いているところを想像してみてください。

住宅の賞品の分布が単峰型で対称的である場合、友達は住宅の平均価格を教えてくれます。実際、市場でほとんどの住宅をその平均値の周りで見つけることが期待できます。

ただし、住宅価格の分布が単峰で歪んでいる場合、たとえば、ほとんどの住宅が低価格帯で左に、一部の法外な住宅のみが右側にある場合、平均は高価格に「歪む」ことになります。権利。

この単峰型の歪んだ住宅価格の分布については、中央値付近の市場でほとんどの住宅が見つかると予想できます。


1
歪んだ単峰分布について言うとき、家の価格分布は中央値あたりの価格を持っているという意味が明確ではありません。言えることは、値の半分は中央値以下になり、半分は中央値以上になるということです。これらの値が平均値にどれほど近いかを示すものではありません。
マイケルR.チェニック

あなたの最後の文が「中央値」で終わることになっていると私は思いますか?もしそうなら、中央値は上記の母集団から取られたランダムなサンプルの平均(達成できないかもしれません、例えば住宅価格ではないかもしれません)に最も近い(達成可能な)値でなければならないことは明らかだと思います。つまり、中央値は平均して、その平均サンプルに最も近くなります。そうでない場合、これらの値が平均値にどれほど近いかについて私は主張しませんでした。私は彼らの中央値までの距離について主張しました。
Sol Hator
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.