どのような現実の状況で、マルチアームバンディットアルゴリズムを使用できますか?


15

マルチアームバンディットは、選択肢があり、どれがあなたの幸福を最大化するかわからない状況でうまく機能します。このアルゴリズムは、実際の状況で使用できます。例として、学習は良い分野です。

子供が大工仕事を学んでいて、それが苦手な場合、アルゴリズムは彼/彼女におそらく先に進む必要があることを伝えます。彼/彼女が上手い場合、アルゴリズムは彼/彼女にその分野を学び続けることを伝えます。

デートも良い分野です:

あなたは女性を追求することに多くの「努力」をかけている男性です。しかし、あなたの努力は間違いなく歓迎されません。アルゴリズムは、「少し」(または強く)先へ進むように微調整する必要があります。

他のどのような現実の状況で、マルチアームバンディットアルゴリズムを使用できますか?

PS:質問が広すぎる場合は、コメントを残してください。コンセンサスがあれば、質問を削除します。


3
(今のところ)3つの支持された答えがあることを考えると、これは答えるには広すぎるとは思わない。
GUNG -復活モニカ

@gungより多くの賛成票がありますが、私の得点には反映されません。どうして?
アンディK

5
これは、このスレッドがコミュニティWiki(CW)@AndyKであるためです。スレッドがCWである場合、人々はアップ投票から評判を得ません(またはダウン投票からそれを失います)。ただし、通常どおりバッジを獲得できます。このような質問や、単一の明確な「正しい」答えが存在しない場所のリストを求めるような質問は、SEサイトでは話題にならないはずです。私たちの妥協(他のサイトもこれを行うと思います)は、そのような質問をケースバイケースで許可するが、CWにすることです。
GUNG -復活モニカ

公正な@gung
アンディK

1
大学入学。寄付された臓器の受信者を選択するためのメトリックの選択。
EngrStudent-モニカの復活

回答:


8

オリジナルのポケモンゲーム(赤または青と黄色)をプレイして青磁市に着くと、チームロケットスロットマシンのオッズは異なります。Porygonを非常に高速に最適化する場合は、マルチアームバンディットを使用してください。

真剣に、人々は機械学習における調整変数の選択に関する問題について話します。特に、多くの変数がある場合は、探査と開発の関係が話題になります。Spearmintのように、またはチューニングパラメーターを選択するために超シンプルなアルゴリズムを使用するこのトピックの新しい論文で さえ参照してください


6

それらは生物医学的治療/研究デザインの設定で使用できます。たとえば、q-learningアルゴリズムは、順次、複数割り当て、ランダム化試験(SMART試験)で使用されると考えています。大まかに言うと、治療法は患者の進行に最適に適応するという考え方です。これが個々の患者にとってどのように最適であるかは明らかですが、ランダム化臨床試験ではより効率的です。


ありがとう@gung。そのアルゴリズムについては知りませんでした。私はそれを読むでしょう
アンディK


2

Quoraで同じ質問をしました

答えはここにあります

  • 組織のさまざまな部門への資金の割り当て

  • 限られた時間と任意の選択閾値を与えられた学生のグループから最高のパフォーマンスのアスリートを選ぶ

  • (A / Bテストの代わりに)新機能を同時にテストしながらWebサイトの収益を最大化する厳密な統計モデルを作成するのに十分なデータがない場合、結果を最適化する必要があるときにいつでも使用できます。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.