均一に分布した数の違いは均一に分布していますか?


22

6面ダイスを何回も振る。

ロールとその前のロールの差(絶対値)を計算すると、差は均一に分布すると予想されますか?

10ロールで説明するには:

roll num  result diff
1           1     0
2           2     1
3           1     1
4           3     2
5           3     0
6           5     2
7           1     4
8           6     5
9           4     2
10          4     0

diff値が均一に分布しますか?


13
少なくとも感覚を
つかむ

2
ポアソン分布を確認してください。
leftaroundabout 8:12

宿題のようなこのルックス....
マヌH

@Manu H、宿題の日がずっと遅れていることを保証します
HeyJude

回答:


37

いいえ、均一ではありません

絶対差の36等しくありそうな可能性を数えることができます

     second 1   2   3   4   5   6
first                           
1           0   1   2   3   4   5
2           1   0   1   2   3   4
3           2   1   0   1   2   3
4           3   2   1   0   1   2
5           4   3   2   1   0   1
6           5   4   3   2   1   0

の絶対差の確率分布を与える

0    6/36  1/6
1   10/36  5/18
2    8/36  2/9
3    6/36  1/6
4    4/36  1/9
5    2/36  1/18

27
@onurcanbektasこの回答の表は、あなたの主張と明らかに矛盾しています。たとえば、可能な差の1つだけが5であり、そのうちの6つが0であることが示されています。
whuber

13
@onurcanbektasテーブルを熟考するためにもう一度招待します。5の絶対的な違いは2つしかないので、5に等しい違いは2つだけであることは明らかではないでしょうか?
whuber

14
@onurcanbektas単純な違い(つまり、符号があるため、-5から+5までの整数)の場合、分布は、モード(最も可能性の高い値)が0の対称離散三角分布です。モードは1です
ヘンリー

2
ただし、6を法とする符号付き差分は均一に分布していることに注意してください。
フェデリコポロニ

2
@FedericoPoloniこれは自明ではないですか?私は、コメントを読む前に、私は決して本当にそれについてかかわら意味、これは単に本当なければならないことは明白である
たけた

21

確率と実数に関する最も基本的な公理のみを使用して、はるかに強力なステートメントを証明できます。

任意の2つの独立した、同じように分布する非定数のランダム値の差は、離散的な均一分布にはなりませんXY

(連続変数の類似のステートメントは、Uniform PDFで2つのrvの差について証明されています。)

アイデアは偶然のことである極端な値が可能性よりも小さくなければならないですする唯一の方法があるので、ゼロである(例えば)最大限違いをゼロにするための多くの方法があるのに対しので、と持っています同じ分布であり、したがって互いに等しくすることができます。詳細は次のとおりです。XYXYXYXY

最初の仮定の二つの変数ことを観察及び当該各のみ有限数達成することができる少なくともそこになるので、正の確率で値を明確な違いとそれらのすべて等しい確率均一な分布割り当てます。場合無限大であり、そのようにチャンスの合計が不可能である無限大であろうそこ正、等しい確率を有する可能相違の数であろう。XYnnn

次に、差異の数は有限であるため、それらの中で最大のものがあります。最大の差は、の最小値を減算する場合にのみ達成できます-mを呼び出し、の最大値から確率がと仮定します-その呼び出しますとは独立して いるため、この違いの可能性はこれらの可能性の積であり、Ymq=Pr(Y=m)XMp=Pr(X=M).XY

(*)Pr(XY=Mm)=Pr(X=M)Pr(Y=m)=pq>0.

最後に、とは同じ分布を持っているため、それらの違いが値生成する多くの方法があります。 これらの方法の中には、および この分布は非定数でため、はとは異なります。これらの2つのケースは互いに素なイベントであり、したがって、がゼロになる可能性に少なくとも量が寄与なければなりません。あれは、XY0.X=Y=mX=Y=M.mM.p 2 + q 2 X Yp2+q2XY

Pr(XY=0)Pr(X=Y=m)+Pr(X=Y=M)=p2+q2.

数字の正方形は否定されないので、我々はから推測そこからその0(pq)2,()

Pr(XY=Mm)=pqpq+(pq)2=p2+q2pq<p2+q2Pr(XY=0),

の分布が均一ではないことを示すQED。XY

コメントに応じて編集する

絶対差の同様の分析と分布が同じであるため、これには、同じ代数的手法でもほぼ同じ結果が得られますが、およびある可能性がありその方程式系には一意の解|XY|XYm=M.Pr(XY=|Mm|)=2pq.2pq=2pq+(pq)22pq+p2+q2=1.p=q=1/2公正なコイン(「両面ダイス」)に対応します。この例外を除いて、絶対差の結果は差の結果と同じであり、すでに説明した同じ理由によります:すなわち、2つのiidランダム変数の絶対差は、3つ以上の異なる差がある場合は常に均一に分布できません正の確率で。

(編集の終わり)


この結果を質問に適用して、もう少し複雑な質問をします。

ランダム変数を使用して、ダイ(不公平なダイである可能性があります)の各独立したロールを これらのロールで観察される違いは、数値 これらの個の数字がどのように均一に分布しているか疑問に思うかもしれません。それは本当に統計的な期待についての質問です。たとえば、ゼロに等しい期待数は何ですか?等しい予想数はいくらですか? Xi, i=1,2,,n.nΔXi=Xi+1Xi.n1ΔXiΔXi1

この質問の問題のある側面は、が独立していないことです。たとえば、とは同じロール伴いΔXi Δ X 1 = X 2 - X 1 Δ X 2 = X 3 - X 2 X 2ΔX1=X2X1ΔX2=X3X2X2.

ただし、これは実際には困難ではありません。統計的期待値は、添加剤であり、すべての違いが同じ分布を有しているので、我々はすべての可能な値を選ぶ場合、差のを、時間の期待数差に等しい全体のシーケンスにおけるロールはわずかであるの回数期待数プロセスの単一ステップで、差がに等しくなります。その単一ステップの期待値は、(すべての)。これらの期待値は、単一の同じである場合にのみ、すべての(つまり、均一)で同じですkknn1kPr(ΔXi=k)ikΔ X のIΔ X IΔXi. しかし、ダイにバイアスがていても、均一な分布を持つはないことがわかりましたしたがって、予想される周波数のこのより弱い意味でも、ロールの差は均一ではありません。ΔXi


@Michael良い点:私は質問に答えました(これは明らかに「違い」についてです)。同じ手法が適用されます。最大と最小の両方の違いを考慮する必要があります。これらが2つだけの可能性がある場合(ゼロとともに)、平等を得ることができます。これは、ベルヌーイ結果がどこから来るかを示しています(それがユニークなそのような例を示しています)。(1/2)
whuber

これの特定のバージョンを証明する別の答えはここにあります
モニカを

ありがとう、@ Ben:私はそのスレッドを忘れていました。より良いリファレンスなので、この回答で直接リンクします。
whuber

12

直感的なレベルでは、ランダムなイベントは、その結果のすべてが均等に発生する可能性がある場合にのみ均一に分散できます。

これは問題のランダムイベントの場合ですか?2つのサイコロのロールの絶対差ですか?

この場合、両極端を見るだけで十分です-この違いが取ることができる最大値と最小値は何ですか?

明らかに、0が最小であり(絶対差を調べており、ロールは同じになることがあります)、5が最大です(6vs 1)。

0が発生する可能性が高い(または少ない)ことを示すことで、イベントが不均一であることを示すことができます5

一見すると、5が発生する方法は2つしかありません。最初のサイコロが6で2番目のサイコロが1の場合、またはその逆の場合です。0はどのように発生しますか?


1
+1これが問題の核心になると思います。最終的に同じ観察に依存する質問の一般化を投稿しました。
whuber

5

Henryが提示したように、均一に分布した分布の違いは均一に分布していません。

シミュレートされたデータでこれを説明するために、非常に単純なRスクリプトを使用できます。

barplot(table(sample(x=1:6, size=10000, replace=T)))

ここに画像の説明を入力してください

これにより、実際に均一な分布が生成されることがわかります。ここで、この分布からの2つのランダムサンプルの絶対差の分布を見てみましょう。

barplot(table(abs(sample(x=1:6, size=10000, replace=T) - sample(x=1:6, size=10000, replace=T))))

ここに画像の説明を入力してください


6
これが、多数のiid値の平均の漸近分布に関係するCLTと関係があるのはなぜですか?
whuber

2
元々CLTで作成した接続が気に入っています。ましょサンプル数が元の均一な分布から追加(または減算)することです。CLTは、が大きい、分布が正規に向かう傾向があることを意味します。これは、OPが求めているように、に対して分布が均一に保てないことを意味します。(これは自明ではない場合、和が均一ときに配布された場合のことを考慮し、インデックスの再作成する場合にも均一であることを暗示する大を含め、等、。)n n > 1 n = 2 n = 2 n = 4 nnnn>1n=2n=2n=4n
krubo

3
@Krubo元の質問では、ダイスの連続するロール間の差の分布について尋ねます。CLTはそれについて何も言うことはありません。実際、サイコロが何回振られても、それらの差の分布は正常に近づきません。
whuber

ダイ面の数が無限になる傾向があるため、この分布は均一になる傾向がありますか?わからないことを示すに取り掛かるが、直感的に、それはその方向にそれの頭のように感じるが、それは漸近的に取得する場合、私は知らない方法を十分に平坦化する前にどこかを「ブロック」
たけた

@Cruncherを使用すると、Rコードのダイ面の数を簡単に変更できます。顔が多いほど、分布の階段の性質がより明確になります。「1」は常にその階段のピークであり、差が大きいほど確率はゼロに近くなります。さらに、「0」の違いは「1」よりも明らかにまれです。(少なくともダイの最小値が「1」の場合)
LuckyPal

2

他の人が計算を行ったので、私にはもっと直感的に思える答えをあげます。2つのunifrom rv(Z = X +(-Y))の合計を調べたい場合、全体の分布は(離散)畳み込み積です:

P(Z=z)=k=P(X=k)P(Y=zk)

この合計はかなり直感的です:取得する確率、X(注意して何かを得るための確率の和であるここ)との補完 -Yとします。zkz

信号処理から、畳み込み積の動作がわかります。

  • 2つの均一関数(2つの長方形)の畳み込み積は三角形を与えます。これは、ウィキペディアで連続機能について説明されています。

ここに画像の説明を入力してください

  • あなたはここで起こるかを理解することができますよう取得する確率にどの対応し、上下に移動両方の長方形の共通ドメインを(縦の点線)を上に移動。zz

  • より一般的には、畳み込みによって安定する関数はガウス関数のみであることを知っています。すなわち、ガウス分布のみが加算(またはより一般的には線形結合)によって安定します。これは、均一な分布を組み合わせたときに均一な分布が得られないことも意味します。

これらの結果が得られる理由については、答えはこれらの関数のフーリエ変換にあります。畳み込み積のフーリエ変換は、各関数のフーリエ変換の単純な積です。これにより、長方形関数と三角形関数のフーリエ係数間の直接リンクが得られます。


申し立ての妥当性と回答の論理を確認してください。問題は、2つの均一分布の畳み込みが均一かどうかではなく、ある分布とその反転の畳み込みが均一になるかどうかです。また、畳み込みの下で安定しているガウス分布よりもはるかに多くの分布族があります(もちろんモジュロ標準化):en.wikipedia.org/wiki/Stable_distribution
whuber

あなたは安定したディストリビューションについて正しいです。質問については、これは(タイトルで示されているように)均一な分布を持つ2つのランダムな値の差に関するものだと確信しています。ある分布とその反転の畳み込みが均一であるかどうかの問題は、ここで求められているものよりも大きい。
lcrmorin

1

場合と二つの連続サイコロのロールがあり、あなたが視覚化することができます()は次のとおりです。各色は異なる値に対応します。xy|xy|=kk=0,1,2,3,4,5k

連続サイコロの差の視覚化

簡単にわかるように、各色のポイントの数は同じではありません。したがって、違いは均一に分布していません。


0

ましょう差示すロールの値を、その後 DtXP(Dt=5)=P(Xt=6,Xt1=1)<P((Xt,Xt1){(6,3),(5,2)})<P(Dt=3)

したがって、関数は一定ではありません。これは、分布が均一ではないことを意味します。P(Dt=d)d

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.