モーメントとは何ですか?それらはどのように導出されますか?


19

通常、母集団のすべてのパラメーターを推定するまで「母集団のモーメントを対応するサンプルに等しくする」ことにより、モーメントの推定量の方法を紹介しています。そのため、正規分布の場合、これらの分布が完全に記述されているため、1番目と2番目の瞬間のみが必要になります。

Eバツ=μ=1nバツ/n=バツ¯

Eバツ2=μ2+σ2=1nバツ2/n

そして、理論的に最大追加モーメントを次のように計算できます。n

Eバツr=1nバツr/n

どのような瞬間に本当に直観を構築できますか?私はそれらが物理学と数学の概念として存在することを知っていますが、特に質量概念からデータポイントまで抽象化する方法がわからないため、直接適用することはできません。この用語は統計で特定の方法で使用されるようで、他の分野での使用とは異なります。

データのどの特性が、全体で何()のモーメントがあるかを決定しますか?r


7
この用語は、確率分布に適用された場合に物理学で行うのと同じことを意味します。参照ここで式有し、、「、電荷密度の分布である質量、または任意の数量検討されています」。「考慮されているもの」が確率密度である場合、対応する確率の瞬間があります。それらは生の瞬間(起源に関する瞬間)です。比較して...(ctd)ρμn=rnρrdrρ
Glen_b-モニカの復職

2
モーメントは、変位値のようなランダム変数の分布のパラメーター化された特徴です。モーメントは自然数によってパラメーター化され、分布を完全に特徴付けます(モーメント生成関数を参照)。これは、一部の分布ではモーメント間に完全な機能依存性が存在する可能性があることを排除していません。(1/2)
tchakravarty

モーメントは、正規分布の最初の2つに機能的に依存しているため、最初の2つで平均と分散を含む分布を特徴付けることができます。(2/2)3
tchakravarty

5
(ctd)... 数学のモーメントは同じです()、0ではなくを除いて(つまり、物理学の単なる一般化された形式-しかし、それらは単なる起源の変更で同じであるため、物理学者は「それはどう違うのか?」と正しく言うでしょう)。が密度の場合、これらは確率と同じです。私にとって、3人全員が「瞬間」と言うとき、同じことについて話しているのであって、異なることについてではありません。c fμn=バツcnfバツdバツcf
Glen_b-モニカの復職

3
瞬間や直感について投稿された多くのスレッドで答えを見つけることができると確信しています。統計は、物理学と数学で使用されるのとまったく同じ方法でモーメントを使用します。これは、3つのフィールドすべてで同じ定義を持つ同じ概念です。
whuber

回答:


17

物理学の授業を受けてからかなり時間が経ったので、これが間違っているかどうか教えてください。

物理的なアナログを使用したモーメントの一般的な説明

ランダム変数取ります。周りのの番目のモーメントは次のとおりです これは瞬間の物理的な感覚に正確に対応します。を、pdfで指定された密度の実線に沿った点の集合として想像してください。この線の下にで支点を置き、その支点に対するモーメントの計算を開始すると、計算は統計的モーメントに正確に対応します。n X c m nc = E [ X c n ] X cバツnバツc

mnc=E[バツcn]
バツc

時間のほとんどは、番目のモーメント 0(支点が0に配置されている瞬間)を中心モーメントを意味する: 番目の中心モーメントである: これは、支点が重心に置かれた瞬間に対応するため、分布のバランスが取れています。以下に示すように、モーメントをより簡単に解釈できます。分布が均衡しているため、最初の中心モーメントは常にゼロになります。XのM N = E [ X N ] N XのM N = M NM 1= Enバツ

mn=E[バツn]
nバツ
m^n=mnm1=E[バツm1n]

の番目の標準化されたモーメントは次のとおりです。 繰り返しになりますが、これは分布の広がりによってモーメントをスケーリングし、特に尖度の解釈を容易にします。最初の標準化された瞬間は常にゼロになり、2番目の瞬間は常に1になります。これは、変数の標準スコア(zスコア)の瞬間に対応します。私は、この概念に対する優れた物理的アナログを持っていません。X M nはnバツ

mn=m^nm^2n=E[バツm1n]E[バツm12]n

一般的に使用されるモーメント

あらゆる分布に対して、潜在的に無限のモーメントがあります。十分なモーメントは、ほぼ常に完全に特徴付けられ、分布します(これを確実にするために必要な条件を導き出すことは、モーメントの問題の一部です)。統計では、一般的に4つの瞬間について多くのことが語られています。

  1. 平均 -最初の瞬間(ゼロを中心に)。これは、分布の重心、または0の支点に対する分布のトルクのモーメントに比例します。
  2. 分散-2番目の中心モーメント。の分布が広がる度合いを表すと解釈されます。これは、支点でバランスが取れた分布の慣性モーメントに対応します。バツ
  3. 歪度 -3番目の中心モーメント(標準化される場合もあります)。ある方向または別の方向の分布のスキューの尺度。正規分布(スキューがない)に比べて、正に歪んだ分布は非常に高い結果になる可能性が低く、負に歪んだ分布は非常に低い結果になる可能性がわずかです。物理的アナログは困難ですが、大まかに言えば分布の非対称性を測定します。例として、下の図はWikipediaから引用したものです。 ウィキペディアから取られた歪度
  4. 尖度 -4番目の標準化された瞬間、通常過剰な尖度、4番目の標準化された瞬間マイナス3。尖度は、が尾に対して分布の中心により多くの確率を置く程度を測定します。尖度が高いとは、平均からの偏差の頻度が低く、偏差の頻度が高いことを意味します。これは、物理的アナログはさらに困難である。ここで、0の故に過剰尖度しばしば3の4番目の標準化されたモーメントを有する正規分布に対して解釈されるが、以下の図において、ウィキペディアから取られ、より高いピークを持つ分布尖度が大きい。 バツ尖度、WIkipediaからも

Kurtosisを超えた瞬間については、めったに直観がほとんどないので、私たちはめったに語りません。これは、物理学者が2番目の瞬間の後に停止することに似ています。


6

これは少し古いスレッドですが、「モーメントは自然数によってパラメーター化され、分布を完全に特徴付けます」と書いたFg Nuのコメントの虚偽の記述を修正したいと思います。

モーメントは、分布を完全に特徴付けるものではありません。具体的には、すべての無限数のモーメントの知識は、たとえ存在する場合でも、必ずしも分布を一意に決定するわけではありません。

私のお気に入りの確率書、Feller「確率理論とその応用Vol IIの紹介」(一般的な分布の実例での私の答えを参照)、セクションVII.3の227-228ページの例では、対数正規は決定されていませんつまり、対数正規分布と同じであるが、異なる分布関数を持つすべての無限数のモーメントを持つ他の分布があることを意味します。広く知られているように、モーメント生成関数は対数正規分布には存在せず、同じモーメントを持つ他の分布にも存在しません。

pで述べたように 228、本質的にゼロではないランダム変数は、それらがすべて存在し、バツ

n=1E[バツ2n]1/2n

分岐します。これはifおよびnot ifであることに注意してください。この条件は対数正規には成り立たず、実際にその瞬間によって決定されることはありません。

一方、すべての無限数のモーメントを共有する分布(ランダム変数)は、それらのモーメントから導き出せる不等式により、大きく異なる場合があります。


分布が制限されている場合、これは大幅に簡略化されます。この場合、モーメントは常に分布を完全に(一意に)決定します。
アレックスR.

@Alexこれは、Fellerで引用された結果の直接的な結果です。
whuber

対数正規分布に対してモーメント生成関数が存在しないと言うのは完全に正しいことではありません。mgfの最も有用な定理は、mgfがゼロを含む開区間に存在し、厳密な意味では存在しないと仮定しています。しかし、それはゼロから発する光線に存在します!そして、それはまた有用な情報を与えます。
kjetil bハルヴォルセン

@ kjetil b halvorsen、ゼロから発する光線上の対数正規分布のMGFの存在から得られる有用な情報(の一部)を説明できますか?それは何の光線でしょうか?
マークL.ストーン

@kjetil b halvorsenへの質問として上記のコメントのバンプ..
マークL.ストーン

2

Glen_bの発言の結果として、最初の瞬間である平均は物理的な物体の重心に対応し、平均の2番目の瞬間である分散はその慣性モーメントに対応するということです。その後、あなたは独力です。


3
私は最初の瞬間と平均の関係が好きです...しかし、2番目の瞬間は分散ではありません...分散は中心の 2次モーメントです...。E[バツ2]=バツ2fバツdバツ var[バツ]=E[バツE[バツ]2]=バツE[バツ]2fバツdバツ
ザカリーブルーメンフェルト

0

二項ツリーには、おそらく0.5のブランチが2つあります。実際、p = 0.5、q = 1-0.5 = 0.5。これにより、確率質量が均等に分布した正規分布が生成されます。

実際には、ツリーの各層が完全であると仮定する必要があります。データをビンに分割すると、部門から実数を取得しますが、切り上げます。まあ、それは不完全な層であるため、通常のヒストグラムに近似することはありません。

分岐確率をp = 0.9999およびq = 0.0001に変更すると、歪んだ法線が得られます。シフトした確率質量。これが歪度の原因です。

不完全なティアまたはビンが2 ^ n未満の場合、確率質量のない領域を持つ二項ツリーが生成されます。これは尖度を与えます。


コメントへの応答:

ビンの数の決定について話していたとき、次の整数に切り上げます。

Quincunxマシンは、最終的に二項式を介して正規分布に近似するようになるボールをドロップします。このようなマシンでは、1)ビンの数が有限である、2)基礎となるツリーがバイナリである、3)確率が固定されているといういくつかの前提があります。ニューヨークの数学博物館にあるQuincunxマシンにより、ユーザーは確率を動的に変更できます。確率は、現在のレイヤーが終了する前であっても、いつでも変更できます。したがって、ビンが満たされていないというこの考え。

ツリーに空白がある場合に元の答えで言ったのとは異なり、分布は尖度を示しています。

これを生成システムの観点から見ています。決定木を要約するために三角形を使用します。新たな決定が下されると、三角形の底部に、分布の観点から、尾にさらにビンが追加されます。ツリーからサブツリーをトリミングすると、分布の確率質量にボイドが残ります。

私はあなたに直感的な感覚を与えるためだけに答えました。ラベル?Excelを使用し、2項式の確率で遊んで、予想されるスキューを生成しました。尖度についてはそうしていませんが、動きを示唆する言語を使用している間、確率質量を静的であると考えることを余儀なくされます。基になるデータまたはボールが尖度を引き起こします。次に、それをさまざまに分析し、中心、肩、尾などの説明用語を形作ることに帰します。作業する必要があるのは、ビンだけです。データができない場合でも、ビンは動的な生活を送っています。


2
これは興味深いですが、非常に大ざっぱです。たとえば、二項ツリーのラベルは何ですか?正規分布を取得したい場合は、無限ツリーである方がよいですが、その後、明白なラベル(ランダムウォークを使用するか、実数のバイナリ表現を使用する)は、正規分布にまったくつながりません。これらの詳細がないと、読者の想像力に余りにも多く残されます。それらについて詳しく説明していただけますか?
whuber
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.