多くのPDFの範囲はマイナスからプラスの無限までありますが、いくつかの手段が定義され、いくつかは定義されていません。どのような一般的な特性が計算可能になりますか?
多くのPDFの範囲はマイナスからプラスの無限までありますが、いくつかの手段が定義され、いくつかは定義されていません。どのような一般的な特性が計算可能になりますか?
回答:
分布の平均は積分の観点から定義されます(連続分布の場合-リーマン積分のように記述します-しかし、問題はより一般的に適用されます.StieltjesまたはLebesgue積分に進んで対処することができますこれらを一度にすべて適切に)
しかし、それはどういう意味ですか?実質的には略記です
または
(ただし、0だけでなくどこでも壊すことができます)
問題は、これらの積分の限界が有限でない場合に発生します。
したがって、たとえば、比例する標準コーシー密度を考えてみてください...
聞かせて、そう d u = 2 x
有限ではありません。下半分の制限も有限ではありません。したがって、期待は未定義です。
または、ランダム変数として標準コーシーの絶対値がある場合、その期待値全体は、先ほど見た制限に比例します(つまり、)。
一方、他のいくつかの密度は「無限大」まで続きますが、それらの積分には限界があります。
他の答えは良いですが、すべての人、特にコーシー分布()を一見して、平均がゼロであることは直感的に明らかだと言う人には納得できないかもしれません 。
数学的観点から直感的な答えが正しくない理由は、リーマン再編成定理(ビデオ)によるものです。
コーシーを見て、「ゼロになるはず」という意味は、実質的にゼロで「センター」を分割し、2つのサイズのバランスの瞬間を主張するということです。または、言い換えると、正の項の「半分」(右側の各ポイントでのモーメント)と負の項の「半分」(左側の各ポイントでのモーメント)で暗黙的に無限合計を行い、それを主張しています合計がゼロになります。(技術的には:)
リーマン再配置定理によれば、このタイプの無限和(正と負の両方の項を持つもの)は、2つの系列(正の項のみと負の項のみ)がそれぞれ独立して収束する場合にのみ一貫します。両方の側(正と負)がそれ自体で発散している場合、任意の数になるように用語の合計の順序を考え出すことができます。(上のビデオ、6:50から)
そのため、はい、0からバランスの取れた方法で合計を行うと、Cauchy分布の最初の瞬間がキャンセルされます。ただし、平均の(標準)定義では、この合計順序は強制されません。モーメントを任意の順序で合計し、等しく有効にする必要があります。したがって、コーシー分布の平均は定義されていません-モーメントを合計する方法を慎重に選択することにより、実質的に任意の時点でモーメントを「バランス」(または非バランス)にすることができます。
したがって、分布の平均を定義するには、2つのモーメント積分がそれぞれ提案された平均を中心に独立して収束(有限)する必要があります(数学を実行すると、完全積分()は収束する必要があります)。テールが片側のモーメントを無限にするのに十分な「脂肪」であれば、完了です。反対側の無限の瞬間とバランスを取ることはできません。
コーシー分布のようなものの「カウンター直観的」な振る舞いは、無限について考えるときの問題によるものです。コーシー分布を取り、xkcdの数値のプラス/マイナスのように、任意に遠くでも、テールを切り取ります。そして、(再正規化されると)突然、適切に動作し、定義された平均を持つ何かを取得します。問題となっているのは自分自身の太った尾ではなく、無限に近づくときの尾の振る舞いです。
アブリアル将軍とグレン_bは完璧な答えを持っていました。コーシー分布の平均が存在しない/収束しないことを示す小さなデモを追加したいだけです。
次の実験では、大きなサンプルを取得し、サンプルから経験的平均を計算しても、数値は実験ごとに大きく異なります。
set.seed(0)
par(mfrow=c(1,2))
experiments=rep(1e5,100)
mean_list_cauchy=sapply(experiments, function(n) mean(rcauchy(n)))
mean_list_normal=sapply(experiments, function(n) mean(rnorm(n)))
plot(mean_list_cauchy,ylim=c(-10,10))
plot(mean_list_normal,ylim=c(-10,10))
あなたは我々が持っていることを観察できるの実験を、各実験では、我々はサンプル1 × 10 5このような大きなサンプルサイズで、二つの分布からのポイントを、異なる実験間で実験的な平均値はかなり近い真の平均にする必要があります。結果は、コーシー分布には収束平均がありませんが、正規分布にはあることを示しています。
編集:
チャットで@ mark999が言及したように、実験で使用された2つの分布は同様の「分散」を持っていると主張する必要があります(引用を使用する理由は、コーシー分布の分散も定義されていないためです)。理由は次のとおりです。PDFは似ています。
curve(dnorm, -8,8)
curve(dcauchy, -8,8)
Lebesgue-Stieltjes積分の定義により、平均は次の場合に存在します。
https://en.wikipedia.org/wiki/Moment_(mathematics)#Significance_of_the_moments
円上の分布は回転対称であるため、円上に平均値、中央値または最頻値は存在できません。同様に、分散などの高いモーメントは意味をなしません。この分布は多くの状況で自然に発生します。たとえば、私の現在のプロジェクトには、癌組織の顕微鏡画像が関係しています。画像内の非常に多くのオブジェクトは対称ではなく、それぞれに「方向」を割り当てることができます。明らかな帰無仮説は、これらの方向が均一に分布しているということです。