タグ付けされた質問 「optimal-stopping」

4
2つの独立した比率の検出力解析で停止ルールを作成するにはどうすればよいですか?
私は、A / Bテストシステムに取り組んでいるソフトウェア開発者です。安定した統計情報の背景はありませんが、過去数か月にわたって知識を集めてきました。 一般的なテストシナリオでは、Webサイト上の2つのURLを比較します。訪問者が訪問LANDING_URLし、URL_CONTROLまたはのいずれかにランダムに転送されますURL_EXPERIMENTAL。訪問者はサンプルを構成し、訪問者がそのサイトで望ましいアクションを実行すると勝利条件が達成されます。これはコンバージョンを構成し、コンバージョン率はコンバージョン率です(通常はパーセンテージで表されます)。特定のURLの一般的なコンバージョン率は、0.01%から0.08%の範囲です。テストを実行して、新しいURLと古いURLを比較する方法を決定します。場合はURL_EXPERIMENTALアウトパフォームに表示されURL_CONTROL、我々は交換してくださいURL_CONTROLとURL_EXPERIMENTAL。 単純な仮説検定手法を使用したシステムを開発しました。このシステムを開発するために、ここで別のCrossValidatedの質問に対する回答を使用しました。 テストは次のように設定されます。 のコンバージョン率の見積もりCRE_CONTROLは、URL_CONTROL履歴データを使用して計算されます。 所望の目標転化率CRE_EXPERIMENTALのがURL_EXPERIMENTAL設定されています。 通常、有意水準0.95が使用されます。 通常、0.8の累乗が使用されます。 一緒に、これらの値はすべて、目的のサンプルサイズを計算するために使用されます。power.prop.testこのサンプルサイズを取得するためにR関数を使用しています。 すべてのサンプルが収集されるまでテストが実行されます。この時点で、の信頼区間 CR_CONTROLとがCR_EXPERIMENTAL計算されます。それらが重ならない場合、勝者は0.95の有意水準と0.8の検出力で宣言できます。 ただし、テストのユーザーには2つの大きな懸念があります。 1.テスト中のある時点で、明確な勝者を示すのに十分なサンプルが収集された場合、テストを停止できませんか? 2.テストの終了時に勝者が宣言されていない場合、勝者を見つけるのに十分なサンプルを収集できるかどうかを確認するためにテストをさらに実行できますか? ユーザーが私たち自身のユーザーが望むことを正確に行えるようにする市販ツールが数多く存在することに注意してください。上記には多くの誤fallがあることを読みましたが、停止ルールのアイデアに出くわしたので、独自のシステムでそのようなルールを使用する可能性を調査したいと思います。 検討したい2つのアプローチを次に示します。 1.を使用power.prop.testして、現在の測定変換率を現在のサンプル数と比較し、勝者を宣言するのに十分なサンプルが収集されているかどうかを確認します。 例:次の動作がシステムに存在するかどうかを確認するテストが設定されています。 CRE_CONTROL:0.1 CRE_EXPERIMENTAL:0.1 * 1.3 これらのパラメーターでは、サンプルサイズNは1774です。 ただし、テストが進んで325サンプルに達すると、CRM_CONTROL(コントロールの測定された変換率)は0.08およびCRM_EXPERIMENTAL0.15です。power.prop.testこれらの変換率で実行Nされ、325であることがわかりました。正確CRM_EXPERIMENTALに、勝者であると宣言するために必要なサンプルの数です。この時点で、テストを終了できることを願っています。同様に、テストが1774サンプルに達しても勝者が見つからない場合、2122サンプルに達しCRM_CONTROL、0.1 CRM_EXPERIMENTALの結果と0.128が勝者を宣言できる結果であることを示すのに十分です。 関連する質問のユーザ少ないサンプルを有し、またに対して脆弱であることを停止し、このようなテストは、早期奨励のためにあまり信憑性であることをお勧め推定バイアスとタイプIとタイプIIエラーの数が増加。この停止ルールを機能させる方法はありますか?これは、プログラミング時間の短縮を意味するため、推奨されるアプローチです。おそらく、この停止ルールは、テストを早期に停止する必要がある場合、テストの信頼性を測定する何らかの数値スコアを提供することで機能するでしょうか? 2. 順次分析またはSPRTを使用します。 これらのテスト方法は、私たちが見つけた状況に合わせて設計されています。ユーザーがテストを開始し、テストで余分な時間を無駄にしないようにテストを終了するにはどうすればよいですか。テストの実行が長すぎるか、異なるパラメーターでテストをやり直す必要があります。 上記の2つの方法のうち、数学が少し理解しやすく、プログラミングが簡単なように見えるため、SPRTを好みます。ただし、このコンテキストで尤度関数を使用する方法がわかりません。誰かが尤度比、尤度比の累積和を計算する方法の例を構築し、モニタリングを続行する状況、帰無仮説と対立仮説を受け入れる状況を示す例を続けることができる場合、 SPRTが正しい方法であるかどうかを判断するのに役立ちます。

3
教科書にないオプションの停止規則
停止規則は、P値と決定に関連するエラー率との関係に影響します。シモンズ等による最近の論文。2011年には、研究者の自由度という用語が、再現不可能であることが判明した心理学の文献の多くのレポートの責任を負うと考えられる行動の集合を記述するために作られました。 これらの動作のうち、オプションの停止規則または宣言されていない中間分析が現在関心のあるものです。エラー率への影響を生徒に説明しますが、生徒が使用する教科書には記載されていないようです。使用する!)。私の大学のメインの書店には、バイオサイエンス、ビジネス、エンジニアリングなど、さまざまな分野の入門レベルの学生を対象とした14の統計教科書があります。停止ルール」。 オプションの停止ルールの問題を説明する入門レベルの統計テキストがありますか? シモンズ、JP、ネルソン、LD、およびサイモンソン、U。(2011)。偽陽性心理学:データ収集と分析の非公開の柔軟性により、あらゆるものを重要なものとして提示できます。心理学、22(11)、1359–1366。doi:10.1177 / 0956797611417632

2
最適なサンプルサイズに達する前にA / Bテストを停止するのはなぜ間違っているのですか?
私の会社では、A / Bテスト(ウェブサイトのバリエーションで実行)の結果を提示する責任があります。私たちは、私が今見つける午前何かがある、月のテストを実行し、その後、我々は有意に達し(または重要性を長時間テストを実行した後に到達されていない場合は放棄)まで定期的にp値を確認してください間違って練習。 私は今、この習慣をやめたいのですが、そうするために、なぜこれが間違っているのかを理解したいと思います。効果サイズ、サンプルサイズ(N)、アルファ有意性基準(α)および統計的検出力、または選択または暗黙のベータ(β)が数学的に関連していることを理解しています。しかし、必要なサンプルサイズに達する前にテストを停止すると、正確に何が変わるのでしょうか。 私はここでいくつかの投稿(つまりthis、this、this)を読みましたが、私の推定には偏りがあり、Type 1エラーの発生率が劇的に増加します。しかし、それはどのようにして起こりますか?数学的説明、つまり、サンプルサイズが結果に与える影響を明確に示すものを探しています。上で述べた要因間の関係に関係していると思いますが、正確な式を見つけて自分で計算することはできませんでした。 たとえば、テストを途中で停止すると、タイプ1のエラー率が高くなります。よし。しかし、なぜ?タイプ1のエラー率を上げるとどうなりますか?ここでは直感が欠けています。 助けてください。

1
釣りの問題
近くの湖で午前8時から午後8時まで釣りに行きたいとします。乱獲のため、1日に1匹しか捕まえないという法律が定められています。魚を捕まえたら、それを維持するか(その魚と一緒に家に帰る)、または湖に投げ戻して釣りを続けるかを選択できます(ただし、後で小さな魚を受け入れるか、まったく魚を捕まえない危険があります)。あなたはできるだけ大きな魚を捕まえたいです。具体的には、持ち帰る魚の予想される質量を最大化する必要があります。 正式には、次のようにこの問題を設定する可能性があります。魚は一定の割合で捕獲され(次の魚を捕獲するのにかかる時間は既知の指数分布に従います)、捕獲された魚のサイズは(既知の)分布に従います。私たちは、現在の時間とあなたが捕まえたばかりの魚のサイズを考慮して、その魚を維持するか、それを投げ返すかを決定するいくつかの決定プロセスを求めています。 だから問題は:この決定はどのように行われるべきか?いつ釣りを止めるかを決める簡単な(または複雑な)方法はありますか?問題は、与えられた時間tについて、最適な漁師が時間tに開始した場合に、どの程度の予想魚量が持ち帰るかを決定することと同等だと思います。最適な決定プロセスでは、魚が予想される質量よりも重い場合にのみ、魚を維持します。しかし、それは一種の自己参照のようです。私たちは最適な漁師の観点から最適な釣り戦略を定義しているのですが、どうすればよいのかよくわかりません。
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.