統計用語の虐殺について謝罪してください:)ここで、広告とクリックスルー率に関連するいくつかの質問を見つけました。しかし、それらのどれも私の階層的状況の私の理解で私をあまり助けませんでした。
関連する質問があります。これらの同等の表現は、同じ階層型ベイジアンモデルですか?、しかし、実際に同様の問題があるかどうかはわかりません。別の質問階層ベイジアン二項モデルの事前分布事前は、ハイパープライアについて詳しく説明しますが、それらの解を自分の問題にマッピングすることはできません
新製品のオンライン広告がいくつかあります。広告を数日間掲載しました。その時点で、広告をクリックして十分な人がクリックを獲得している広告を確認しました。クリック数が最も多いものを除いてすべてを追い出した後、広告をクリックしてから実際にどのくらいの人が購入したかを確認するために、さらに数日間実行します。その時点で、そもそも広告を掲載するのが良いアイデアであったかどうかがわかります。
私は毎日数個のアイテムしか売っていないので、私は多くのデータを持っていないので、私の統計はとてもうるさいです。したがって、広告を見た後に何人の人が何かを購入するかを推定することは本当に困難です。150回のクリックごとに約1つだけが購入につながります。
一般的に言って、広告グループごとの統計をすべての広告のグローバル統計で何らかの方法で平滑化することにより、各広告でできるだけ早くお金を失うかどうかを知る必要があります。
- すべての広告が十分な購入数に達するまで待つと、時間がかかりすぎるため、壊れてしまいます。10個の広告をテストするため、各広告の統計情報が十分に信頼できるように10倍のお金を費やす必要があります。その時までに私はお金を失ったかもしれません。
- すべての広告を平均して購入すると、うまく機能していない広告を追い出すことはできません。
グローバル購入率( N $サブ分布を使用できますか?つまり、各広告のデータが多いほど、その広告の統計情報はより独立したものになります。まだ誰も広告をクリックしていない場合、世界平均が適切であると思います。
そのためにどのディストリビューションを選択しますか?
Aで20回、Bで4回クリックした場合、どのようにモデル化できますか?ここまでで、二項分布またはポアソン分布がここで意味をなすかもしれないことがわかりました。
purchase_rate ~ poisson
(?)(purchase_rate | group A) ~ poisson
(グループAのみの購入率を推定しますか?)
しかし、実際にを計算するには、次に何をしますかpurchase_rate | group A
。グループA(または他のグループ)にとって意味のある2つのディストリビューションをプラグインするにはどうすればよいですか。
最初にモデルを適合させる必要がありますか?モデルを「トレーニング」するために使用できるデータがあります。
- 広告A:352回のクリック、5回の購入
- 広告B:15回のクリック、0回の購入
- 広告C:3519回のクリック、130回の購入
いずれかのグループの確率を推定する方法を探しています。グループに含まれるデータポイントが数個しかない場合、基本的に世界平均にフォールバックしたいと思います。私はベイジアン統計について少し知っており、ベイジアン推論や共役事前分布などを使用してモデル化する方法を説明する多くの人々のPDFを読みました。これを適切に行う方法はあると思いますが、正しくモデル化する方法がわかりません。
ベイジアン的な方法で問題を定式化するのに役立つヒントにとても満足しています。これは、実際にこれを実装するために使用できる例をオンラインで見つけるのに大いに役立ちます。
更新:
お返事ありがとうございます。私は自分の問題について少しずつ理解し始めています。ありがとうございました!問題をもう少しよく理解しているかどうかを確認するために、いくつか質問をさせてください。
私が想定して変換がベータ分布として配布されており、ベータ分布は、2つのパラメータを持っているとと。
の パラメーターはハイパーパラメーターなので、前のパラメーターですか?最後に、ベータ分布のパラメーターとしてコンバージョン数とクリック数を設定しましたか?
ある時点で異なる広告を比較したいので、。その式の各部分を計算するにはどうすればよいですか?
は、尤度、またはベータ分布の「モード」と呼ばれると思います。それでは、そのα - 1、とαおよびβ私の分布のパラメータです。しかし、ここでの特定のαとβは、広告Xだけの分布のパラメータですよね?その場合、それはこの広告で見られたクリック数とコンバージョン数だけですか?または、すべての広告で見られたクリック数/コンバージョン数はどれくらいですか?
それから、私は事前情報(P(変換))を掛けます。これは、私の場合は情報量の少ないジェフリーズ事前情報です。より多くのデータを取得しても、以前のバージョンは変わりませんか?
限界尤度であるで割るので、この広告がクリックされた頻度をカウントしますか?
ジェフリーズの以前のものを使用する際、私はゼロから始めており、私のデータについて何も知らないと想定しています。その事前は「非情報的」と呼ばれます。データについて学習し続けているときに、事前データを更新しますか?
クリックとコンバージョンが発生すると、ディストリビューションを「更新」する必要があることを読みました。これは、私の分布のパラメーターが変わることを意味しますか、それとも以前の変更を意味しますか?広告Xのクリックがあった場合、複数のディストリビューションを更新しますか?事前に複数ありますか?