ある一定数のための(例えば4)、それはのための確率分布を求めることができる我々が持っているように、?X V a r(X )= r
ある一定数のための(例えば4)、それはのための確率分布を求めることができる我々が持っているように、?X V a r(X )= r
回答:
の場合を注意深く検討します 場合、分布は縮退しますが、 はなんらかの意味があります。つまり、任意のc \ neq \ muに対しておよび\ Pr(X = c)= 0です。したがって、Xの多くの可能な分布を見つけることができますが、それらは\ mu \ in \ mathbb {R}によってインデックスが付けられ、完全に指定されます。r = 0 X
場合、、分布は見つかりません。
、答えは、追加情報がについて知られていることに依存します。たとえば、平均がであることがわかっている場合、および、を取ることにより、これらのモーメントの分布を見つけることができます。これは、平均と分散のマッチングの問題に対する一意の解決策ではありませんが、これは正規分布の唯一の解決策です(ダニエルが指摘するように、すべての可能な解決策の中で、これはエントロピーを最大化するものです)。たとえば、3番目の中心モーメント以上に一致させる場合も、より広い範囲の確率分布を考慮する必要があります。
代わりに、モーメントではなく、の分布についての情報があったとします。たとえば、がポアソン分布に従うことがわかっている場合、一意の解はます。が指数分布に従うことがわかっている場合は、一意の解、ここで解いてパラメーターを見つけました。
他の場合では、ソリューションのファミリー全体を見つけることができます。が長方形(連続均一)分布に従うことがわかっている場合、解くことにより、分布の一意の幅を見つけることができます。しかし、すべてのソリューションファミリーが存在し、によってパラメーター化され —このセットの分布はすべて相互の変換です。同様に、が正規の場合、任意の分布 が機能します(したがって、でインデックス付けされたソリューションのセット全体があり、これも任意の実数であり、ファミリはすべて変換です。お互いの)。もし次ガンマ分布形状スケールパラメータを使用して、その後、我々は、溶液の全ファミリーを得ることができ、によってparametized。このファミリーのメンバーはお互いの翻訳ではありません。「ソリューションの家族は」どのように見えるか、ヘルプ可視化するために、ここでインデックス化正規分布のいくつかの例ですでインデックス化した後、ガンマ分布、分散を持つすべての例に対応する、4に等しいであなたの質問。
一方、一部の分布では、の値に応じて、解を見つけることができる場合とできない場合があります。たとえば、がベルヌーイ変数でなければならない場合、に対して2つの可能な解があります。これは、方程式を解く確率が2つあるためです、そして実際にはこれらの2つの確率は相補的です。つまり、です。以下のためにのみ一意解が存在する、そしてためにないベルヌーイ分布は、十分に高い分散を有していません。
ケースについても言及する必要があると思います。この場合にも解決策があります。たとえば、2自由度のスチューデントの分布があります。
プロットのRコード
require(ggplot2)
x.df <- data.frame(x = rep(seq(from=-8, to=8, length=100), times=5),
mu = rep(c(-4, -2, 0, 2, 4), each=100))
x.df$pdf <- dnorm(mean=x.df$mu, x.df$x)
ggplot(x.df, aes(x=x, y=pdf, group=factor(mu), colour=factor(mu))) + theme_bw() +
geom_line(size=1) + scale_colour_brewer(name=expression(mu), palette="Set1") +
theme(legend.key = element_blank()) + ggtitle("Normal distributions with variance 4")
x.df <- data.frame(x = rep(seq(from=0, to=20, length=1000), times=5),
theta = rep(c(0.25, 0.5, 1, 2, 4), each=1000))
x.df$pdf <- dgamma(x.df$x, shape=4/(x.df$theta)^2, scale=x.df$theta)
ggplot(x.df, aes(x=x, y=pdf, group=factor(theta), colour=factor(theta))) + theme_bw() +
geom_line(size=1) + scale_colour_brewer(name=expression(theta), palette="Set1") +
theme(legend.key = element_blank()) + ggtitle("Gamma distributions with variance 4") +
coord_cartesian(ylim = c(0, 1))
あなたは「それが見つけることが可能であることを意味と仮定すると、確率分布のためにあなたがすることを任意の条件指定していないとして、その後答えは、イエスである」満たさなければならないが。実際、この条件を満たす可能性のある分布は無限にあります。正規分布考えてみてください。あなたは、設定することができますと好きなの任意の値を取ることができます-あなたがしてあります必要に応じて。
実際、正規分布は、特定の平均と分散の最大エントロピー確率分布であるため、この点ではかなり特殊です。
この質問は、面白く、完全に簡単なものではない方法で解釈できます。確率変数のように見える 何かが与えられた場合、その分散があらかじめ指定された数と等しくなるように、その値に確率を割り当てる(または既存の確率をシフトする)ことがどの程度可能ですか?その答えは、の範囲によって決まる限界まで、可能なすべての値が許容されるということです。
このような分析の潜在的な関心は、確率変数を変更しながら、確率変数を固定し、特定の目的を達成することです。このアプリケーションは単純ですが、数学的ファイナンスの基本的な結果である、ギルサノフの定理の根底にあるアイデアのいくつかを示しています。
この質問を厳密で明確な方法で言い直してみましょう。と思います
は、シグマ代数して測定空間で定義された測定可能な関数です。与えられた実数、この空間である確率測度をいつ見つけることができますか?
答えは、これが場合に可能であると信じています。 (上限と下限の両方が達成された場合、つまり、実際には最大値と最小値が等しい場合、等式が成立します。)または場合、この条件に制限を課さず、分散のすべての非負の値が可能です。
証明は構造によるものです。 詳細を処理し、基本的なアイデアを突き止めるために、単純なバージョンから始めて、実際の構築に移りましょう。
ましょうの画像であって:この手段がいる。集合関数定義の指標であることがである:場合と場合。
以降、明らかに満たす確率の最初の二つの公理。3番目を満たしていることを示す必要があります。つまり、シグマ加法であるということです。しかし、これはほぼ同じように明白です。が相互に排他的なイベントの有限または可算無限のセットである場合、それらのいずれにもが含まれていません- この場合はすべてのに対して、それらの1つだけにが含まれます。この場合、特定のに対してになり、それ以外の場合はすべての。どちらの場合にも
両側が両方ともまたは両方です。
以来、のすべての確率を集中、分布集中され及びゼロ分散を有していなければなりません。
してみましょうの範囲内の2つの値である ; つまり、およびです。前のステップと同様の方法で、メジャーを定義して、とインジケーターの加重平均にします。を決定するには、負でない重みおよびを使用します。前と同じように、 -(1)で説明した指標メジャーの凸の組み合わせ-は確率メジャーであることがわかります。この測度に関するの分布は、ベルヌーイスケーリングされ、でシフトされた。ベルヌーイ分布の分散はであるため、の分散はなければなりません。
(2)の即時の結果は、任意の点であるいる存在の範囲でといます
の分散にすることができます。以来、これが意味します
に最大値と最小値がある場合に限り、等式が保持されます。
逆に、がこの境界を超える場合、解は不可能です。なぜなら、任意の有界確率変数の分散は、その範囲の二乗。
はい、そのような分布を見つけることは可能です。実際、であるため、有限の分散を持つ任意の分布を取り、条件に合わせてスケーリングできます
たとえば、区間一様分布には分散があります: したがって、区間一様分布は分散を持ちます。
実際、これは、Student tなどの一部の分布にパラメーターを追加する一般的な方法です。パラメータは1つ、自由度のみです。とき標準正規分布に収束。鈴の形をしていて、通常のように見えますが、尻尾が太くなっています。これが、尾が太い場合に正規分布の代わりとしてよく使用される理由です。唯一の問題は、ガウス分布に2つのパラメーターがあることです。つまり、Student tのスケーリングされたバージョンが登場します。これは、「tロケーションスケール」分布とも呼ばれます。これは非常に単純な変換です:。ここで、は位置とスケールです。これで、スケールを設定して、新しい変数 必要な分散があり、スチューデントt分布の形状になります。