私は、各ラウンドの後に5ラウンド以上の賭けで損耗を伴う一連の勝ち負けの賭けに関するデータを持っています。次のようなディシジョンツリーを使用してデータを表示しています。
ツリーの上部にあるノードは、勝ちの賭けをしているノードであり、ツリーの下部にあるノードは、負けの賭けの実行を持っています。(a)各ノードでの消耗(b)各ノードでの平均ベットサイズの変化を確認したいと思います。前のノードからの各ノードの消耗率と生存率(確率が50%の場合に各ノードで予想される人数を使用)を調べています。たとえば、確率が各ノードで50%の場合、開始された1000のうち、約500人が2番目のノードWとLにいるはずです。仮説は(a)損耗率賭け(b)は、賭けのサイズが敗者の後に減少し、勝者の後に引き上げられることを意味します。
最初に、これを非常に単純な一変量設定で実行したいだけです。50人が脱落した場合、ノードWWからノードWWWへの平均ベットサイズの変化が統計的に有意であることを示すために、どのようにt検定を実行できますか?これが正しいアプローチであるかどうかはわかりません。後続の各ベットは独立していますが、敗者の後に人々は脱落しているため、サンプルは一致しません。同じクラスが一連の試験を次々と受験し、誰も脱落することのない場合であれば、適切なt検定の実行方法は理解できますが、これは少し異なると思います。
これどうやってするの?また、結果が少数の顧客によって歪められている場合、どうすれば上位5%と下位5%を取り除くことができますか?累積賭け金が最も高い顧客をベット1-3から削除するだけですか?
図が生成された元のデータがあるので、各ノードに平均値、標準誤差、標準誤差などがあります。