分布密度関数から、下のグラフが示すように、コーシー分布の平均(= 0)を特定できました。しかし、なぜコーシー分布には意味がないと言うのでしょうか?
分布密度関数から、下のグラフが示すように、コーシー分布の平均(= 0)を特定できました。しかし、なぜコーシー分布には意味がないと言うのでしょうか?
回答:
期待値が存在しないことを機械的に確認できますが、少なくともホイヘンスの原理と大数の法則を受け入れる場合、これは物理的に直感的でなければなりません。大数の法則の結論はコーシー分布では失敗するため、平均をとることはできません。独立したコーシー確率変数を平均すると、結果は確率として収束しません。同じサイズのコーシー分布のままです。これは光学において重要です。0 のn → ∞ 1
コーシー分布は、点光源からの線上の光の正規化された強度です。ホイヘンスの原理によれば、光源とターゲットの間の任意のラインから光が再放射されると仮定することにより、強度を決定できるとされています。したがって、メートル離れたラインの光の強度は、最初にメートル離れたラインに光が当たり、任意の前方角度で再放射されると仮定して決定できます。メートル離れたライン上の光の強度は、メートル離れたライン上の光の分布の畳み込みとして表すことができます。つまり、独立したコーシー分布の合計は、係数スケーリングされたコーシー分布です。1 n n 1 n n
コーシー分布は、平均値を持っていた場合には、のパーセンタイルで割っ倍畳み込みに収束しなければならない大数の法則によって。代わりに、一定のままです。パーセンタイルをメートル離れた(透明な)線、メートル離れた線などにマークすると、これらのポイントは度の直線を形成します。それらは向かって曲がりません。n n 0 25 1 2 45 0
これは特にコーシー分布について説明しますが、明確な物理的解釈を持たない平均のない分布があるため、積分テストを知っておく必要があります。
Michael Chernicksの回答に対する@whuberのコメントに対する回答として追加された回答(およびwhuberによって指摘されたエラーを削除するために完全に書き直されました。)
Cauchy確率変数の期待値の積分値は、値を好きなように「作成」できるため、未定義と言われています。積分 (リーマン積分の意味で解釈される)は、一般的に呼ばれるものです。不適切な積分とその値は、制限値として計算する必要があります: または
コーシーのプリンシパル値は、単一の制限として取得されます: 上記の二重制限の代わりに。limitandの値はすべてのに対してため、期待積分の主値はであることが簡単にわかります。ただし、これを使用して、コーシー確率変数の平均がであると言うことはできません。つまり、平均は、主値の意味ではなく、通常の意味での積分の値として定義されます。
ため、代わりに積分を考える は制限値に近づきます を 。場合は、私たちは、主値を取得上述し。したがって、式に明確な意味を割り当てることはできません
確率論に対して測定理論的アプローチを使用しており、期待値積分がルベーグ積分の意味で定義されている場合、問題はより単純です。は、場合にのみ存在します は有限であるため、は有限ではないため、はコーシー確率変数に対して未定義です。
選択したポイント(0)は平均ではないため、コーシーには平均がありません。それは、中央値とモード。絶対連続分布の平均は、として定義されます。ここで、は密度関数で、積分はの領域(コーシーの場合はからで取得されます。コーシー密度に関しては、この積分は単に有限ではない(から半にあると半分からにするある)。F F - ∞ ∞ - ∞ 0 - ∞ 0 ∞ ∞
コーシー分布は、単位円上の均一な分布と最もよく考えられているため、平均化が意味をなすのであれば驚くべきことです。が何らかの「平均化関数」であったと仮定します。つまり、単位円の各有限サブセットについて、が単位円の点であったと仮定します。明らかに、は「不自然」でなければなりません。より正確には、は回転に関して同変ではありません。より一般的ではあるが明らかにされていない形式でコーシー分布を取得するには、単位円を(0,1)からx軸に投影し、この投影を使用して円上の均一分布をx軸に転送します。X f (X )f f
平均が存在しない理由を理解するには、xを単位円上の関数と考えてください。単位円上に無限数の互いに素なアークを見つけるのは非常に簡単です。たとえば、アークの1つが長さdである場合、そのアークのx> 1 / 4dです。したがって、これらの互いに素なアークのそれぞれは平均の1/4以上に寄与し、これらのアークからの合計寄与は無限です。同じことを再び行うことができますが、x <-1 / 4dで、合計の寄与から無限大を差し引いたものです。これらの間隔は図で表示できますが、相互検証用の図を作成できますか?
ある確率変数の平均値または期待値は、ある確率測度定義されたルベーグ積分です: P E X = ∫ X D P
コーシー確率変数の平均が存在しないということは、コーシーrvの積分が存在しないことを意味します。これは、Cauchy分布の裾が重い裾であるためです(正規分布の裾と比較してください)。ただし、期待値の非存在は、コーシー確率変数の他の関数の存在を禁止しません。
ここに視覚的な説明があります。(数学に挑戦している私たちにとって。)コーシー分布の乱数ジェネレーターを使用して、結果の値を平均してみてください。これのための機能に関する良いページがここにあります。 https://math.stackexchange.com/questions/484395/how-to-generate-a-cauchy-random-variable ランダムな値の「スパイク」により、小さい値ではなく大きい値になることがわかります。 。したがって、それは意味がありません。
優れた答えに追加するために、積分の非収束が統計的実践に関連する理由についていくつかコメントします。他の人が言及したように、プリンシパル値を「平均」にした場合、slnはもはや有効ではありません。これとは別に、実際には、すべてのモデルが近似であるという事実の意味について考えてください。具体的には、コーシー分布は無制限の確率変数のモデルです。実際には、ランダム変数には境界がありますが、境界はしばしばあいまいで不確実です。制限のないモデルを使用することはそれを軽減する方法であり、不確実な(そしてしばしば不自然な)境界をモデルに導入することを不必要にします。しかし、これが理にかなっているためには、問題の重要な側面に影響を与えるべきではありません。つまり、境界を導入する場合、それは重要な方法でモデルを変更するべきではありません。しかし、積分が非収束の場合、それは起こりません!モデルは、RVの期待がほとんど任意の境界に依存するという意味で不安定です。(アプリケーションでは、必ずしも境界を対称にする理由はありません!)
ちょっとうるさくなりたかった。上部のグラフィックが間違っています。x軸は標準偏差にあり、コーシー分布には存在しません。私は仕事で私の毎日のコーシー分布を使用するため、私はうるさいです。混乱が経験的エラーを引き起こす可能性がある実際的なケースがあります。1自由度のスチューデントのt分布が標準のコーシーです。通常、重要性に必要なさまざまなシグマがリストされます。これらのシグマは標準偏差ではなく、推定エラーであり、muがモードです。
上記の図を正しく実行したい場合、x軸は生データであるか、同等のサイズのエラーが必要な場合は、等しい確率のエラーを与えます。可能性のあるエラーの1つは、正規分布でのサイズの.67標準偏差です。どちらの場合も、準四分位範囲です。
さて、あなたの質問への答えについては、誰もが上に書いたすべてが正しいです、そして、それはこの数学的理由です。ただし、あなたは学生であり、このトピックに慣れていないため、視覚的に明らかな反直感的な数学的解決策が当てはまらない可能性があります。
コーシー分布から引き出された2つのほぼ同一の実世界のサンプルがあり、どちらも同じモードと同じ可能性のあるエラーを持っています。1つは平均1.27で、もう1つは平均1.33です。平均値が1.27の標準偏差は400であり、平均値が1.33の標準偏差は5.15です。両方の可能性のあるエラーは.32で、モードは1です。これは、対称データの場合、平均が中央の50%にないことを意味します。任意の検定で平均値および/または分散を有意差外にプッシュするために、追加の観測が1つだけ必要です。その理由は、平均と分散はパラメーターではなく、サンプル平均とサンプル分散はそれ自体が乱数であるためです。
最も簡単な答えは、コーシー分布のパラメーターに平均が含まれていないため、平均に関する分散がないことです。
あなたの過去の教育学では、平均の重要性は、それが通常十分な統計であるということであった可能性があります。長期実行頻度ベースの統計では、コーシー分布には十分な統計がありません。実数全体をサポートするコーシー分布のサンプル中央値が十分な統計量であることは事実ですが、それは順序統計量から継承するためです。それは偶然にも十分なものであり、それについて考える簡単な方法が欠けています。これで、ベイジアン統計にはコーシー分布のパラメーターに十分な統計があり、均一な事前分布を使用する場合も偏りがありません。日常的に使用する必要がある場合は、推定を実行するためのあらゆる方法について学習しているため、これを取り上げます。
切り捨てられたコーシー分布の推定量として使用できる有効な順序統計はありません。これは、現実世界で実行される可能性が高いため、すべてではありませんが、ほとんどの場合、頻度ベースの方法には十分な統計がありません。
私が示唆しているのは、何かを現実のものとして、精神的に、平均から離れることです。これはハンマーのようなツールであり、広く有用であり、通常使用できます。そのツールが機能しない場合があります。
正規分布とコーシー分布に関する数学的なメモ。データが時系列として受信される場合、tが無限大になるにつれて誤差がゼロに収束するときにのみ正規分布が発生します。データが時系列として受信される場合、エラーが無限に発散するとコーシー分布が発生します。1つは収束級数によるもので、もう1つは発散級数によるものです。コーシー分布は制限の特定のポイントに到達することはなく、固定ポイントを前後にスイングするため、時間の50%が一方の側にあり、時間の50%が他方の側にあります。復帰の中央値はありません。