期待値と最も可能性の高い値(モード)


15

分布の期待値はf(x)平均、つまり加重平均値

E[x]=+xf(x)dx

最も可能性の高い値はモードであり、最も可能性の高い値です。

しかし、何回かを何度も見ると予想しますか?ここから引用:E[x]

結果確率が等しくない場合、単純平均を加重平均に置き換える必要があります。これは、一部の結果が他の結果よりも高い可能性があるという事実を考慮に入れています。ただし、直観は同じままですの期待値は、平均して発生すると予想される値です。xix

「平均して」とはどういう意味か理解できませんが、これは、重要な意味で、他のの値よりもを見るのに多くの時間を費やすことを意味しますE[x]xますか?しかし、これはモードの定義ではありませんか?

それでは、ステートメントをどのように解釈するのでしょうか?そして、確率的意味は何ですか?E[x]


また、私が混乱する例を示したいと思います。研究χ2分布私はそれを学んだモードが あるχmode2=ν2、つつ、E[χ2]=ννデータの自由度です。

私がやったときに、ことを大学で聞いたχ2のデータセットにフィットするように最小二乗法を使用した後にテストを、私は得ることを期待すべきであるχ2ν「それは一般的に何が起こるかだ」ので。


私はこのすべてを誤解しましたか、それとも期待値はどういうわけか非常にありそうですか?(最も可能性の高い値がもちろんモードであっても)


4
私はこの質問に対するチケットインボックスの比phorの力が本当に好きです。なぜなら、それは単純で明確な答えを生み出すからです:ランダム変数の期待値は、(チケットに描かれた)値の合計をチケットの数。それでおしまい。この定義(またはより洗練された数学的な同等物)に従わないステートメントは、単なる発見的であり、状況によっては正しくない可能性があります。
whuber

回答:


18

正規分布の場合、期待値(別名平均)はモードに等しくなります。

一般に、期待値は最も可能性が高い(または最高密度である)だけでなく、発生する可能性がない場合があります。たとえば、確率がそれぞれ0.5の0または2に等しいランダム変数Xを考えます。その場合、EX = 1ですが、期待値1の発生確率は0であり、0と2は両方とも分布のモードです。

「xの期待値は、平均して起こると予想されるもの」という引用は、技術的な素人の言語であり、混乱から明らかなように、問題を混乱させるだけです。期待値は、数学的な平均としての確率において非常に具体的な意味を持っています。一方、素人の言語では、期待値または「平均」は、通常発生すると予想されるものです。「平均」が発生するものの数学的平均であると解釈される場合、これらは調整できます。

予想通り、

ジョー・アベレージ


1
可能性が保証されている中央値はどうですか?
ブライトスター

@TrevorAlexanderが言ったように、モードも保証を与えません。連続分布のモードを検討してください。
ティム

3
@Trevor Alexander可能な中央値は常にあります(正の確率または密度)。ただし、必ずしもすべての中央値が可能なわけではありません。ランダム変数Xの中央値は、任意の点mのためのものである及びP X M 1 / 2。Xは1,2,3、または4、確率1/4とそれぞれ等しい場合、区間[2,3]内の任意の数は、Xの中央値であるPバツm1/2Pバツm1/2
マークL.ストーン

5

期待値はアプリオリに非常に抽象的であり、最も可能性の高い結果であると考える理由はありません。他の人が指摘しているように、確率変数を構築するのは簡単ですXが連続の場合は密度も同じです)

Pバツ=Eバツ=0
バツ

期待値の唯一の正当化、および「頻繁に表示されることが予想される」理由は、多数の法則です

あなたが持っている場合はの独立同一分布変数は X Iを、その後、nバツ

バツ1++バツnnEバツ

適切な意味については、現時点で調査するのは無意味です)

どういう意味ですか?確率p > 1でコインを投げると想像してくださいランディングヘッドの 2。これは番号1に関連付けられ、ランディングテールの確率1-p(つまり0)。最も可能性の高い結果は何ですか?1!(つまり、頭)期待値はいくらですか?EX=1P+01-P=Pp>1211p0

Eバツ=1p+01p=p

これで明らかに「p」は発生しません(先頭または末尾、0または1)。

しかし、コインを10.000回発射し、スローされた回数を超えて出てきた回数を記録します。この数は、私たちが直感的に考えている平均(「平均頭数」)をキャプチャします。そして、大きな数の法則は、この数がE X = pに近いことを示していますEバツ=p


大きな数の法則が期待値の唯一の正当化であるとは言いません。たとえば、en.wikipedia.org / wiki /…は、効用関数の期待値を考慮する正当な理由です(証明を研究していませんが、それが何らかの形で多数の法則に基づいている場合は驚いています)。
ジュホコッカラ

3

「期待値」という用語は好きではなく、確率を教えるときに使用しませんでした。私の意見では、6面ダイスの算術平均は3.5ですが、そのような数値は発生しないため、「算術平均」の方が優れています。私はもともと、大学にいたときにコンセプトの「期待値」という言葉を聞きました。技術用語の多くは、明白な非技術的な意味に同意しません。(「または」が思い浮かびます。)

分布には複数のモードがある場合がありますが、算術平均は一意であることに注意してください。モード、平均、および中央値は異なり、用途も異なります。


1
「または」の素敵なもの。それは、代替のいくつかの定理を研究した線形計画法の私のコースを考えさせました。それらは「Aが真であるかBが真であるが、両方ではない」という形式でした。A xor Bとして表現する方がはるかに簡単です。カジュアルなストリート会話でxorを使用することはあまりありません。
マークL.ストーン

2

違いは、離散分布で最もわかりやすくなります。

各数値が同様に描画される可能性が高い2つの値セット、{1,2,2,2,10}と{1,2,2,2,3}を考えます。

両方とも同じモード(2)ですが、期待される値は異なります。期待値は大きな値に余分な重みを付けますが、モードは単に頻繁に発生する値を探します。したがって、この分布から何回も引き出した場合、サンプルの平均は期待値に近くなりますが、最も一般的な整数はモードに近くなります。

mode=arg最大fバツバツfバツため、各xの重みが考慮されます。

言語を使用して中心傾向の異なる尺度を区別することは、統計を学習する際の一般的な問題です。たとえば、中央値は、平均のような大きな値で歪んでいない別の指標です。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.