サイコロのロールに影響を与えることができると言う精神病者のためのテストを設計する


11

私が友人を持っているとしましょう(彼を「ジョージ」と呼びましょう)、彼は彼の心を使ってサイコロの出目を制御できる(つまり、彼が考えている特定の数にサイコロが落ちる可能性が高くなります)と言っています。

科学的に厳密なテストを設計して、彼が実際にこれを実行できるかどうかを判断するにはどうすればよいですか?(もちろん、彼ができるとは本当に思っていませんが、テストを開始する前に、アメージングランディスタイルのテストの詳細に同意してほしいと思います。)(非常にありそうな)ポストテストの言い訳を減らしたい彼が思いつくだろうこと。

ここに私がこれまでに持っているものがあります:

  1. サイコロの物理的なローリングテクニック(サイコロ、シェーカーカップ、着陸面など)を決定する

  2. サイコロのX個のロールで構成される「テストセッション」を定義します。これは、1度に行うには十分に小さい必要がありますが、サイコロが公平に落ちたかどうか、または片方を優先したかどうかを95%〜99%の信頼度で(分析後に)判断するのに十分な大きさである必要があります

  3. 選択したサイコロでYセッションを実行し(ジョージからの影響なし)、「コントロール」として、サイコロが自分で「公正な」結果を表示することを確認します。

  4. GeorgeとZセッションを実行します。それぞれの前に、個別のサイコロを振って、そのセッション全体でジョージが「集中する」数字を決定します。

  5. 結果をコンパイルして分析します。

  6. ジョージは彼の悲惨なパフォーマンスのいくつかの言い訳をします。

だからあなたへの私の質問:

  • 私の方法論全体に欠陥や問題はありますか?ジョージが反対する可能性が高いことは何ですか?

  • D6を使用する必要がありますか?またはD20?それは重要ですか?同じように自信のある結果を出すには、より多くのフェースを持つダイでより多くのロールが必要になるでしょうか?それとも反対ですか?実際の考慮事項から、私は多くよりも少ないロールを好むでしょう:)

  • XY、およびZの適切な値は何ですか?それらは完全に無関係ではありません。選択したXの値が1つのセッションの95%の信頼しか許さない場合、ジョージの影響がなくても、20セッションごとに1つが「失敗」する可能性があります。

  • 個々のセッションの「成功」または「失敗」を定義するにはどうすればよいですか?(カイ二乗検定の詳細を通過するこの質問を見つけたので、それが私の評価方法だと思いますが、妥当な信頼しきい値とは何ですか?)

  • テスト全体の「成功」または「失敗」を定義するにはどうすればよいですか?ジョージはたった1回のセッションで「勝つ」かもしれませんが、テスト全体に合格するには、Zセッションの何回をパスする必要がありますか?

MS Excelスプレッドシートでこれらの結果を分析することになります。


もし彼が彼の心でサイコロを操作しているだけなら、誰かがそれらを投げるはずです。D6やD20のようなものはジョージに任せるべきだと思います。ジョージはどんな操作ができると言ったのですか?彼は彼が望んだ特定の数を出すことができると言いましたか?もしそうなら、成功はその数のインスタンスであり、失敗はそれ以外のものです。
ジョン

@ジョン-彼はそうでない場合よりも頻繁にその数を上げることができると主張しているだけであり、常にその数が現れるとは限らない。
BradC、2011

(元々はmath.stackexchange.com/q/57624/14626でこの質問のバージョンを尋ねました)
BradC、

Michael HardyとTonyKによる数学の回答はどちらも非常に優れています。
ジョン

4
95%や99%という低い信頼水準では満足できません。異常な主張には異常な証拠が必要になる傾向があります。あるいは、よりベイジアンの状況に当てはめると、彼がそのような能力を持っているという私の以前の信念は非常に低いので、私の事後の信念を意味のある形で変えるには、とんでもない量の証拠が必要になります。
マイケルマッゴーワン、2011

回答:


2

これを次のように分析することをお勧めします。

ジョージが成功として結果を予測し、その他すべてを失敗として予測した各役割を数えます。次に、ジョージの成功確率と95%または99%の信頼区間を簡単に計算できます。彼はランダムにサイコロを振るだけでなく、「2回も」結果を予測できると主張していますか?次に:

H0:p> = 1/3

H1:p <1/3

(6面ダイスを想定)。

そこから、仮説検定を行うのはかなり簡単です。また、(Excelなどでも)簡単に演繹的にパワーを計算できます。ロールの数(10など)を選び、行(0〜10)として成功する可能性のあるテーブルを作成します。次に、成功ごとに、彼がその多くの成功を収める確率を計算します(彼が単に推測している場合、これは彼がやっていることを想定しています)。また、各値について、それがnullの拒否または受け入れにつながるかどうかを判断します。次に、検出力を見つけるには、nullが拒否される確率をすべて合計するだけです。


1

D20では、カイ2乗検定を実行する必要がある場合、ジョージが成功するためには、同じ有意水準のより多くのロールが必要になります。ただし、完全二乗検定を実行する必要はないと思います。あなたは、サイコロが偶然よりも「選ばれた」数を振るかどうかをチェックする必要があるだけです。私は二項式累積分布関数を使用して、偶然よりも頻繁に選択した数値をローリングするp値を計算しますθ=16バツ


選択した側をランダム化することはおそらく問題ではありません、私はただ心配していましたA)サイコロのすべての可能な真のバイアスの説明とB) 1つの単一の異常なセッション(私が話した真のランダム性による20分の1 を確認します彼の精神能力の確認とは見なされません。X(および信頼レベル)が十分に高ければ、各セッションに1つずつ、6セッションで十分でしょう。
BradC 2011
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.