Kはベルヌーイ試験で成功、またはジョージルーカスの映画実験


23

私は今「酔っぱらいの散歩」を読んでいて、そこから一つの物語を理解できません。

ここに行く:

ジョージルーカスが新しいスターウォーズ映画を製作し、あるテストマーケットでクレイジーな実験を行うことに決めたと想像してください。彼は「スターウォーズ:エピソードA」と「スターウォーズ:エピソードB」という2つのタイトルで同一の映画をリリースしています。各映画には独自のマーケティングキャンペーンと配給スケジュールがあり、対応する詳細は同一です。ただし、一方の映画の予告編と広告は「エピソードA」、もう一方の映画のエピソードは「エピソードB」です。

今、私たちはそれからコンテストを作ります。どの映画がより人気がありますか?最初の20,000人の映画ファンを見て、彼らが選んだ映画を録画したとしましょう(両方に行って、両者の間に微妙ではあるが意味のある違いがあると主張する頑固なファンを無視します)。映画とそのマーケティングキャンペーンは同一なので、この方法でゲームを数学的にモデル化できます。すべての視聴者を一列に並べ、各視聴者のコインを順番に反転させることを想像してください。コインが着地した場合、彼または彼女はエピソードAを見ます。コインが着地した場合、エピソードBになります。コインはどちらの方法でも同じ確率で出現するため、この実験的な興行戦争では、各映画が約半分の時間でリードしていると考えるかもしれません。

しかし、ランダム性の数学は別の言い方をします:リードの変化の最も可能性の高い数は0であり、2つの映画の1つが20,000人の顧客すべてをリードする可能性は、リードが継続的にシーソーするよりも88倍高い」

私は、おそらく間違って、これを単純なベルヌーイ裁判の問題に起因するものであり、リーダーが平均してシーソーを行わない理由がわからないと言わなければなりません!誰でも説明できますか?

回答:


22

以下は、ジョージルーカスの実験をシミュレートするRコードです。

B<-20000
steps<-2*rbinom(B,1,0.5)-1
rw<-cumsum(steps)
ts.plot(rw,xlab="Number of customers",ylab="Difference")

実行すると、次のような写真が得られます。

ここに画像の説明を入力してください

ここで、AとBの販売チケットの違いはy軸にあります。

次に、このようなシミュレートされたジョージルーカスの実験を回実行します。各実験で、に費やされた時間の割合、つまり、Aに販売されたチケットの数がBに販売されたチケットの数以上である並ぶ視聴者の割合を計算します。直感的には、 dは、この割合は約と言います。結果のヒストグラムは次のとおりです。0 1 / 210,00001/2

ここに画像の説明を入力してください

割合は期待値であるという意味で、平均で、しかしに近い値に比べて低い値であるまたは。ほとんどの実験では、ほとんどの場合、差は正または負です。1 / 2 1 / 2 0 11/21/21/201

赤い曲線は、アークサイン分布の密度関数で、分布としても知られています。何上の写真に示されていることは最初として知られている定理であるランダムウォークのためarscine法の単純な対称ランダムウォークのステップ数が無限大に近づくにつれて、上に費やした時間の割合の分布と言い、になる傾向アークサイン分布。この結果の標準的なリファレンスは、ウィリアム・フェラーによる確率論とその応用の紹介、Vol 1のセクションIII.4です。Beta(1/2,1/2) 00


シミュレーションスタディのRコードは

prop<-vector(length=10000)
for(i in 1:10000)
{
    steps<-2*rbinom(B,1,0.5)-1
    rw<-cumsum(steps)
    prop[i]<-sum(rw>=0)/B
}
hist(prop,freq=FALSE,xlab="Proportion of time spent above 0",main="George Lucas experiment")
curve(dbeta(x,1/2,1/2),0,1,col=2,add=TRUE)

ありがとう!Rをインストールし、すべての手順を繰り返したいのですが、10,000回のシミュレーションを実行して、費やした時間の割合を計算するにはどうすればよいですか?
-andreister

@andreister:答えを編集し、最後にシミュレーション用のコードを追加しました。それがあなたのお役に立てば幸いです!
MånsT

おかげで、それは非常に便利です!内容を確実に理解するために、コードに基づいてpastebin.com/mtRdsPkPを作成しました。フリックできますか?
アンドレイスター

@andreister:それはよさそうです!視聴者が並んでいると想像するcumsum代わりに、なぜかという質問に答えるために、sumどの映画を観てチケットを購入したかを確認します。cumsum部分合計のベクトルを与えるので、1番目の要素は1人の視聴者の後にAがどれだけ先/後ろにあるか、2番目の要素は2人の視聴者の後の2番目の要素、3人の視聴者の後の3番目の要素などを示します。要素が正の場合、Aには最初の人の視聴者よりも多くの視聴者がいます。それが負の場合、Bは、より多くの視聴者を持っていたし、それが0であれば、彼らは視聴者と同じ数の持っていたii
MånsT

(続き)これは、リーダーがシーソーするかどうかを見たいので、私たちが興味を持っている情報です。sumすべての1と-1を合計するだけで、20,000人の視聴者全員が考慮された後の最終結果(cumsumベクトルの最後の要素)が得られます。
MånsT

11

AとBの両方に、試行回数(奇数を避けるために奇数)の後に、チャンスがあります。ただし、これらのイベントは関連しています。後にどちらが先である持っている後に控えになるチャンス、そしてこれは、より劇的な取得増加。、T 、T = 1 3 / 4 、T = 3 、T1/2tt=13/4t=3t

リードの変更の平均数は、試行の総数が増加するにつれて無限に増加しますが、ゆっくりです。次元でドリフトのないランダムウォークは繰り返し発生するため、どのようにリードしても、将来のある時点で(無限の試行回数で)結びつく可能性はです。ただし、1人だけリードしても、再びあなたがいるまでの予想時間は無限です。偶数に戻るには非常に長い時間がかかる可能性があります。111

とはいえ、このモードは効果を誇張するために使用されています。件の試験でリードの変更がまったく見られないのは実際には驚きです。20,000

いくつかの確率を計算したい場合は、対角線を越えない格子歩行に似たものを数える必要があります。反射原理または反射法と呼ばれる、このような線を横断しないランダムウォーク(およびブラウン運動)に適用される優れた組み合わせ法があります。これは、カタロニア語の数を決定する1つの方法です。他の2つのアプリケーションを次に示します。

がより先に終了するシーケンスの数はです。終わる各配列において、いずれかのリード決して、またはれるいくつかの点があり、リードの最初であるが。場合リードを獲得後で裁判を逆にすれば、その後、あなたがで終わるシーケンスを取得、これは全単射です。したがって、最終的になるシーケンスの数は、がリードすることはありませんでした10 A10,2009,800102009800BBB979910201102009800(20,0009,800)(10,200,9,800)BBB(9,799,10,201)(10,200,9,800)BB(20,0009,800)(20,00010,201)=(20,0009,800)(20,0009,799)=(20,0009,800)40110,201.したがって、最終的に場合、ある時点でが先行している可能性は約であることがわかります。B(10,200,9,800),96%

が遅れないようにするためのエンドポイントを持つシーケンスの総数はしたがって、が決して遅れない確率は約です。リードが変わらない可能性は、リード変更の平均数は約です。AA 1(20,00010,000)220,000/10,000π.A 11100π56150π1/89.56


ありがとう!私はあなたの答えを理解する前に記法を理解する必要があります!「10,200-9,800先に進む」などとはどういう意味ですか、どこから番号を取得しますか?モードが20Kであるとどのように見えますか?
-andreister

という値は一例です。それは可能な結果の1つにすぎません。またはに対して同じ種類の分析をできが何のモードでもないと言ったとは思わない。あなたの引用は、「リードの変更の最も可能性の高い数は」、つまりがモードであることを意味します。ただし、これは近いを持つ幾何分布に似てい。最も可能性の高い値は(ベースの規則を使用する場合)が、そうではありません。わずかに低い確率で他の多くの可能性があります。11 000 - 9 000 10 001 - 9 999 20 000 0 0 P 0 0 010,2009,80011,0009,00010,0019,999.20,00000p000
ダグラスザーレ

0

「2つの映画の1つが20,000人の顧客すべてをリードする可能性は、たとえば、リードが継続的にシーソーするよりも88倍高い」

平易な英語で:映画の1つが早期にリードされます。最初の顧客はAまたはBに行かなければならないので、そうする必要があります。そうすれば、その映画はリードを失う可能性があります。

完璧なシーソーが非常にありそうにないことを思い出すまで、88倍の可能性があります。これをグラフィカルに示すMansTの回答のチャートは、魅力的ではありません。

サイド:個人的には、<buzzword-alert>バイラルマーケティングのために88回以上になると思います</buzzword-alert>。各人は他の人に自分が見たものを尋ね、同じ映画を訪れる可能性が高くなります。彼らは無意識のうちにこれを行います:人々は何かを見に行くために長い列に参加する可能性が高くなります。すなわち、最初の数人の顧客の間でランダム性がリーダーを作成するとすぐに、人間の心理学はリーダーとしてそれを維持します:-)。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.