観測から確率分布関数を構築する


7

N個のプレーヤーとM個のオブジェクトがあり、各オブジェクトには値があります。各プレイヤーはオブジェクトを選択する際の戦略を持っています。プレイヤーは各ラウンドでオブジェクトを選択し、多くのプレイヤーは同じオブジェクトを選択できます。ただし、各オブジェクトの値は、それを選択したすべてのプレーヤー間で均等に分割されます。ゲームごとに9000ラウンド(選択肢)があります。私たちの目標は、ゲームの最後に蓄積する価値を最大化することです。

質問:決定が確率変数であると仮定して、各プレイの確率分布関数を作成するにはどうすればよいですか?

現在のアプローチ:私の現在のアプローチは、プレーヤーが特定のオブジェクトを選択する頻度をカウントし、ラウンドの総数で割ることです。これにより、プレーヤーがその特定のオブジェクトを選択する可能性が高くなります。

問題:各プレーヤーが積極的にプレイし、可能な限り予測不可能(ノイズ)にしようとすると、私の現在のアプローチでは、確率分布関数が正確ではありません(9000ラウンドでは十分なデータではないようです)。これらの分布関数を構築するより良い方法はありますか?

注:私は(ベイズモデルおよびHMM)が頻度カウントよりも優れていることをどこかで読んだことがありますが、それをこの状況にどのように適応させるかはわかりません。


2
分布について何か推測できますか?私が知っているすべての方法は、いくつかのパラメトリックモデルを想定し、データを指定してパラメーターをトレーニングします。一部のモデルは他のモデルよりも一般的です(そして、一部の人々は、仮定をスキップして、とにかく使用可能な結果を​​もたらすことがわかっているモデルをトレーニングします)。しかし、いかなる仮定もなしに(厳密な方法で)できることはたくさんあると思います。
ラファエル

@Raphaelあなたはそれを選択した人々の間でオブジェクトを分割した後にプレイヤーが彼らが得ることができる最も高い価値を好むと仮定することができます、あなたはあなたが持っているアイデアで答えを投稿できますか?
Mike G

回答:


1

質問が何であるか、または(実験的な)分布が推定される観察結果が何であるかを正確に理解しているとは思いません。

分布推定の問題は、コンピュータサイエンスよりも統計に関連していますが、この分野でも同様です。

2つの主要なアプローチを使用するさまざまな方法があります。

  1. 確率分布のパラメーター化されたモデル。ここでは、1つ(事前の知識があると仮定)は、データ(観測)に応じていくつかの自由パラメーターを持つ分布(たとえば、ガウス)の事前定義されたモデル(またはフォームまたは関数)を使用し、これらのパラメーター(たとえば、最尤法またはEMアルゴリズムまたは最大エントロピーなどを介して)。確率分布の形式が不明な場合でも、この方法はガウシアン混合モデルのような近似で使用できます。このメソッドは、前のフォームが基になる確率に近いと仮定して、滑らかな(そして通常はロバストな)推定分布を生成します。分布。

  2. パラメータ化されていないモデルでは、データから直接PD全体(そのフォームを含む)を推定します。このカテゴリのメソッドは、Parzenウィンドウとカーネル推定です。この方法は、基礎となるpdfの形式が完全に不明であるか、ある意味で非自明であるか不規則であるという条件で、パラメーター化された推定よりも優れています。

以前のすべての方法は、計算上効率的です(ただし、多項式である必要はありません)。これは、シンプレックスアルゴリズムが機能する方法に似ていますが、多項式時間ではありませんが、多くの実際的な状況で効率的です。


1

私はあなたが間違ったアプローチを使用していると思います。ゲーム理論を使用して、最適なプレーを見つけることをお勧めします。

の特別なケースから始めます N=2; 各プレイヤーはM 選択肢があるため、 M×M支払いマトリックス。支払いマトリックスは簡単に定義できます。最適な戦略は、(一般的に)ランダム化された戦略です。ペイアウトマトリックスが与えられれば、最適な戦略を計算する標準的な方法があります。次に、最適な戦略を再生できます。だから、N=2、このゲームを解くのは簡単です。

ために N>2、ゲーム理論は少し複雑になりますが、同様のアイデアは、各プレイヤーが過去に選択した分布を推定するよりも、この問題へのより良いアプローチを表すと思います。結局のところ、過去の歴史は必ずしも将来のプレーを表すものではありません。プレーヤーは時間の経過とともに選択肢を変更する可能性があるため、ゲームの早い段階での選択肢の分布は、ゲームの後半での選択肢の分布を表していない場合があります。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.