この最近のゲーム理論の質問は、私に考えさせられました(もちろん接線です):ゲーム理論を使用して取り組む研究質問を選択するための個人的な戦略を効率的に最適化することは可能ですか?
質問の形式化に向かうために、次の(非公式に述べられた)仮定を行います。
- 私は同様に、私が利用できる特定の問題を「楽しんで」います(「好きなことをしてください!」という「ソフト」(そして正しい!)答えを避けるために)。
- 私が取り組むことを選択した特定の問題に対する答えを見つけることに成功する場合も、しない場合もあります。どんな問題に対しても、問題を解決するのにどれだけ上手くいくかの確率の見積もりがあります(それに時間を費やした後)。
- 私の目標は、最終的に評価されるとき(仕事に応募する、テニュアに応募する、フェローシップに応募する、など)に私の報酬を最大化することです。 。私は問題ごとの正確な見返りについて明確な考えを持っていませんが、合理的な見積もりをすることができます。
- 問題のペイオフと問題の難易度の間には、緩やかな逆の関係があります。私の目標のもう1つの声明は、違いを「ゲーム」することです(つまり、「ぶら下がり果物」を探します)。
- この全体的な問題のインスタンスは、研究の質問のリスト(おそらく無限数)によって指定され、それに質問の価値と質問の難易度の見積もりをしっかりと付けます(計算コストなしで、入力として与えられます)。私は敵(私を評価している人)に対してこのゲームをプレイしています。自然は、与えられた問題を解決する確率を与えられ、それを試みることを選択した後に問題を解決するかどうかを決定します。
何が起こっているのかを実際に形式化するために(そして、興味のない、または議論/議論型の応答を回避します)、この問題を、無限のアクションセットを持つ不完全な情報を持つ広範な形式のゲームと見なします。
質問:このタイプのゲームは効率的に計算できないと思います。しかし、ほぼ私のペイオフを最大化する多項式時間アルゴリズムはありますか?PTASはどうですか?
または、代わりに、この問題に対してより正確なゲーム理論モデルがありますか?もしそうなら、同じ質問が成り立ちます:私は(およそ)ペイオフを効率的に最大化できますか?もしそうなら、どのように?