サンプル実行4/11を追加
ルールの明確化4/8:すべての提出物は、私のコンピューターが48時間で実行できる限り多くの試合で構成される1つの巨大なすべて無料のトーナメントで競います。
Twitchでストリームを視聴している人はだれでも、DeepBotの流行に気付いており、おそらくBank Heistのベッティングゲームにも精通しています。このキングオブザヒルトーナメントは、そのゲームから直接インスピレーションを得ています。でも心配しないで。私は、物事を面白く保つために、このバージョンに十分な追加のねじれを投入したと思います。
簡単な例
#####GAME 13: 16 players######
Round 1:
gunHeCK bet 0.
PassivePanga bet 69.
SnitcherKing bet 1.
Lurker bet 0.
OC'sRandomTpyos bet 1.
MonisAddiction bet 69.
RaysFive01K bet 28.
LimeadeSneaktar bet 1.
KaylorrCriterion bet 0.
HardHatUmar bet 0.
HeCKuSumer bet 185.
Round 2
HeCKuSumer decided to !guncheck.
LimeadeSneaktar decided to double cross.
MonisAddiction decided to all in.
OC'sRandomTpyos decided to acquire intel.
RaysFive01K decided to deposit.
SnitcherKing decided to finger.
PassivePanga decided to !guncheck.
Results
PassivePanga failed. :(
SnitcherKing failed. :(
OC'sRandomTpyos was successful, and may gain ¥0
MonisAddiction failed. :(
RaysFive01K was successful, and may gain ¥0
LimeadeSneaktar was successful, and may gain ¥1
HeCKuSumer failed. :(
Results:
0. KaylorrCriterion: 3600
1. Lurker: 3600
2. gunHeCK: 3600
3. SnitcherKing: 3586
4. PassivePanga: 2634
5. LimeadeSneaktar: 2496
6. HeCKuSumer: 1909
7. HardHatUmar: 490
8. RaysFive01K: 255
9. OC'sRandomTpyos: 170
10. MonisAddiction: 0
(In this round, 7 players joined the heist, but the dice only rolled right for 3 of them. Of those, only LimeadeSneaktar brought any home--having stolen it from OcsRandomTpyos. RaysFive01K won significantly more, but deposited it all at the bank before leaving. At this point, the players who did not heist are doing well, living off their day jobs.)
#####GAME 14: 231 players######
Round 1:
Lurker bet 0.
HeCKuSumer bet 190.
KaylorrCriterion bet 0.
HardHatUmar bet 0.
MonisAddiction bet 0.
OC'sRandomTpyos bet 1.
gunHeCK bet 0.
LimeadeSneaktar bet 1.
RaysFive01K bet 25.
PassivePanga bet 69.
SnitcherKing bet 1.
Round 2
PassivePanga decided to !guncheck.
OC'sRandomTpyos decided to buy guard.
HeCKuSumer decided to !guncheck.
SnitcherKing decided to finger.
RaysFive01K decided to deposit.
LimeadeSneaktar decided to double cross.
Results
HeCKuSumer failed. :(
OC'sRandomTpyos failed. :(
LimeadeSneaktar failed. :(
RaysFive01K failed. :(
PassivePanga failed. :(
SnitcherKing failed. :(
Results:
0. KaylorrCriterion: 3840
1. Lurker: 3840
2. gunHeCK: 3840
3. SnitcherKing: 3825
4. PassivePanga: 2805
5. LimeadeSneaktar: 2495
6. HeCKuSumer: 1959
7. HardHatUmar: 490
8. MonisAddiction: 240
9. RaysFive01K: 229
10. OC'sRandomTpyos: 161
Six players heisted--but should have been paying more attention to the rabble and backed out, because the probabilities dropped too low to win, and all failed.
#####GAME 15: 300 players######
Round 1:
OC'sRandomTpyos bet 1.
Lurker bet 0.
SnitcherKing bet 1.
MonisAddiction bet 69.
LimeadeSneaktar bet 1.
gunHeCK bet 0.
HardHatUmar bet 0.
RaysFive01K bet 22.
KaylorrCriterion bet 0.
HeCKuSumer bet 195.
PassivePanga bet 69.
Round 2
HeCKuSumer decided to !guncheck.
OC'sRandomTpyos decided to buy guard.
MonisAddiction decided to all in.
PassivePanga decided to !guncheck.
LimeadeSneaktar decided to double cross.
RaysFive01K decided to deposit.
SnitcherKing decided to finger.
Results
OC'sRandomTpyos failed. :(
SnitcherKing failed. :(
MonisAddiction was successful, and may gain ¥0
LimeadeSneaktar failed. :(
RaysFive01K failed. :(
HeCKuSumer failed. :(
PassivePanga failed. :(
And here, the probabilities dropped too low to win again--except for MonisAddiction, who went all in, and therefore avoided the probability modification incurred by the rabble backing out. No winnings are listed here, because a player who wins going all in immediately adds all winnings to its holdings without any possible modification by other players' actions.
ゲームのルール
トーナメント/ゲーム構造
- トーナメントは、1000〜1100の間でランダムに選択された多数のゲームで構成され、すべての深刻な提出物がすべて無料で同時に競います。
- すべてのプレーヤーは240 クレジットで最初のゲームを開始し、後続の各ゲームは前のゲームの終了時に持っていたクレジット数で開始します。
- 各ゲームは2ラウンドで進行し、各ラウンドでは、プレイヤーはランダムに一律に決定された順序で呼び出され、1つの決定を下します。
- 最初のラウンドでは、プレーヤーは、銀行強盗への参加を賭けるために、0から現在のクレジット保有までの任意の整数のクレジットを支払うことができます。
- 第2ラウンドでは、少なくとも1クレジットを賭けて強盗に参加することを選択した各プレイヤー(以下「ヘイスター」と呼びます)は、その賭けに乗ることを決定することができます(そうする間に、他のアクションを実行する可能性があります)。強盗からオプトアウトするか、オールインします。(これらのオプションについては、以下でさらに説明します。)
- 強盗の数と彼らが支払ったクレジットの総数に基づいて、強盗を上演する5つの銀行の1つが選択されます。この選択は、個々の勝利の確率と配当が決定されるオッズに影響します。(銀行については以下で説明します。)
- オプトアウトしなかった各ハイスターは、銀行の(修正された)確率で、その賭け金に銀行の(修正された)賭けオッズ(端数切り捨て)を掛けたものを勝ち取るか、または賭け金を失います。各プレイヤーの成功または失敗は個別に決定されることに注意してください。他のプレイヤーが失敗した場合に成功するプレイヤーもいます。
- 参加したかどうかにかかわらず、すべてのプレーヤーは成功したか失敗したかを確認し、給料を受け取ります(下記の例外を除く)。
- ゲームを完全に終了することは不可能であることに注意してください。最悪の場合、プレイヤーはゲームを待って次の給料を受け取る必要があります。
- すべての1000-1100ゲームの後、最も多くのクレジットを持つプレイヤーがそのトーナメントの勝者として宣言されます。
- トーナメントは不特定の回数(48時間以内に計算できる回数)繰り返され、すべてのトーナメントのプレイヤーの収益が合計されて、このコンテストの全体的な勝者が決定されます。
第2回ベッティングラウンド
- 最初のラウンドで積極的な賭けをしたプレーヤーは、2番目のラウンドに参加できます。
- このラウンドでは、プレーヤーは次のことができます。
- ベットをキャンセルするには、「back out」という文字列で返信します。これにより、現在の強盗の賭け金がゼロに設定され、強盗に残っているプレイヤーが成功する確率がわずかに低下します。このオプションを採用することにより、プレイヤーは、残りのハイスターを危険にさらすための罰として、強盗に続く240クレジットの給料を差し控えます。(残りのハイスターは、銀行の確率に「バックアウト」しなかったハイスターの割合を掛けた確率で成功します。)
- 「オールイン」という文字列で返事をして、クレジット保有全体を吹き飛ばし、次の240クレジットペイチェックで給料日ローンを取ります-強盗のために最高のギアとインテルをすべて購入し、単独で入ります誰にでも依存しています。このようなプレーヤーの勝利確率は、強盗から脱落した他のハイスターの影響を受けず、その勝利はダブルクロッサーによって盗まれることもありません。勝ちの配当は、その賭けがクレジット保有全体に240を加えたものであるかのように決定され、損失はその保有をゼロに設定します。
- 前の賭けに固執し、通常通り強盗で通り抜けるために、他の文字列(空の文字列を含む)で返信します。(推奨返信:「!guncheck」)。特定の返信には、追加の副作用があります。
- 「ジョブを変更する」と応答すると、プレーヤーはジョブを終了します。このラウンドを開始すると、各ラウンドの終わりに、プレーヤーは5%のチャンスで新しいポジションに雇用されます。これが成功すると、プレーヤーは雇われ、すぐに最初の給料を受け取ります。新しいジョブはそれぞれ、最後のジョブよりも正確に5%高い金額(端数切り捨て)を支払うことが保証されています。このアクションは、強盗が成功したかどうかにかかわらず成功します。
- 「inquire」の応答は、強盗が成功した場合、プレイヤーがその強盗からのすべての賞金を費やしてクレジットごとに余分な0.00001を得るため、そのプレイヤーだけのために強盗された銀行のオッズに費やされます。このオッズ変更は永続的です。例として、プレイヤーが銀行1を強盗するときにこのアクションを選択し、強盗で6969クレジットを獲得した場合、そのプレイヤーの銀行1のオッズは恒久的に0.06969増加し、プレイヤーは強盗から何も受け取りません。
- 「警備員を購入する」という返事は、プレイヤーが強要されている銀行の警備員の一人を買い取る原因となります。そのプレイヤーの給料(ガードの通常の賄bri)の1クレジットの永久的な引き下げと引き換えに、プレイヤーは(そのプレイヤーが警官に「言及するのを忘れる」ためにその銀行で「永続的な」増加した勝利確率を受け取ります質問)。確率は、その銀行でのプレイヤーの現在の勝利確率と100%の差のちょうど1%増加します。このアクションは、強盗が失敗しても成功します。注:いつでも、プレイヤーがすべてのガード賄briを支払うのに十分なクレジットを持っていない場合、即座に「永久に」支払うことができなかった賄briの数と同じ数の確率ボーナスを失います。
- 「デポジット」の返信は、強盗が成功した場合、強盗された銀行の口座にプレイヤーの全賞金を残します。クレジットはいかなる目的でもアクセスできず、撤回されるまでプレイヤーのスコアにカウントされません。このアカウントは、ゲームごとに0.14%の利率で支払います。
- 「撤回」の返信は、強盗が成功した場合、強盗された銀行の口座の内容全体をプレーヤーの賞金に追加します。その結果、アカウントはゼロになります。これらの追加の賞金は、ダブルクロッサーによって盗まれる可能性があることに注意してください。
- 「ダブルクロス」の返信は、次の2つのいずれかを実行します。
- 「ダブルクロス」をプレイしたヘイスターの数が、強盗と一緒に進むことを決定した非ラブルヘイスターの総数の10分の1(切り捨て)である場合(または、そのようなプレイヤーが10人未満の場合は正確に1人) )、プレーヤーは、すべての非ダブルクロッサーの合計賞金をダブルクロッサーの数で割った(切り捨て)に等しい追加の賞金を受け取ります。この場合のすべての非二重交差者は、強盗から0クレジットを受け取ります。言い換えれば、ダブルクロッシングは他のすべてのクレジットを盗み、それを均等に分けます。
- 「ダブルクロス」をプレイしたハイスターの数がしきい値を超えた場合、プレーヤーは(その強盗が成功した場合)賞金を受け取らず、給与を半分に削減し、仕事から解雇されます。(「ジョブの変更」を参照してください。)この場合のすべての非ダブルクロッサー(ラブルを含む)は、すべてのダブルクロッサーの合計賞金を非ダブルクロッサーの総数で割ったボーナスを受け取ります。言い換えれば、陰謀が大きすぎて秘密を守ることができず、陰謀者は根こそぎにされて強盗から排除され、誰もが罰のために賭け金を分けました。
- 「finger」(「二重交差悪党ネズミの運指」のような)の返信は、強盗が成功した場合、プレイヤーに8つの機会を与えます(非ラブルハイスターのセットから交換して均一に描画します)。まだまだ特定されていないクロッサー。
- この方法で特定された各二重交差者は、撃たれる代わりに現在の保有クレジットの25%(切り捨て)をすぐに支払い、職を失い、給与を半分に削減します(上司は悪い行動を容認しないため) 、強盗されている銀行での勝利の確率の5%を失います(将来、他の強盗は非常に疑わしく、物事が毛むくじゃらになるとバスの下に投げる可能性が高いため)。この方法で特定されたダブルクロッサーは、他のダブルクロッサーのダブルクロスが成功したかどうかには影響しませんが、ダブルクロスから盗まれたクレジットを受け取ることはなく、盗まれたクレジットは再分配され、ダブルクロッサー。
- この方法でダブルクロッシングが特定されない場合、スニッチは全員の時間を無駄にするためにステッチを取得します。また、現在の強盗からの賞金の半分を支払い、その給料を5%カットします(ボスはタトルテールの時間をカットします)、そして失う現在の銀行でのベッティングオッズの5%(他のハイスターは将来の賞金に寛大/公平になる可能性が低いため)。このようにして失われた勝ちの半分は、ダブルクロッサーが成功した場合は指のないダブルクロッサーに、ダブルクロッサーが失敗した場合は非ダブルクロッサー(ラブルを含む)に分配されます。
銀行
銀行はインデックスを使用して選択されますnumheisters + int(totalamountbet/100000)
。numheistersはラウンド1で正の賭け金を賭けたプレーヤーの数で、totalamountbetはそれらすべてのプレーヤーの賭け金の合計です。言い換えれば、10万クレジットは追加のハイスター1つと同等です。このインデックスに基づいて、次の銀行の1つが選択されます。この銀行は、インデックスが満たすか、または超える最大のしきい値を持つ銀行です。
Bank Index Threshold Victory Prob. Bet Odds
---- --------------- ------------- --------
0:Municipal 0 0.540 0.80
1:City 20 0.488 1.10
2:State 40 0.425 1.30
3:National 60 0.387 1.65
4:Federal Reserve 80 0.324 1.95
トーナメントが継続するにつれて、各プレイヤーがベットできる金額が上昇傾向になるため、最高の銀行レベルに達する可能性が高くなることに注意してください。また、これらは「acquire intel」または「buy a guard」アクションによって変更される前の初期のオッズと確率にすぎないことに注意してください。最初の確率とオッズでは、市と国立銀行だけが予想損失を上回る勝利を予想しています。
ラッブル
- トーナメントには、「ラブル」と呼ばれる500人の他のプレーヤーも含まれています。これらのプレーヤーは、強盗に通常のプレーヤーとして参加しますが、最終的に得点されません。これらは、各ゲームを異なるものにし、多少予測しにくくし、少数の「本物の」プレーヤーでも、よりリスクの高い/より価値のある銀行に到達することを可能にします。
- 各ゲームには、すべてのサブセットをランダムに選択して参加するための一部のサブセットが含まれます。
- すべての競合は次の戦略を使用します。
- このラウンドですでに決定を下したプレイヤーの決定に基づいて選択される銀行で成功する確率に等しい確率で、ランダムに賭けることを選択します。
- ゼロ以外の金額をベットする場合、現在の保有額を超えない範囲で最大の金額を選択してください:69、420、6969、80085。
- 2回目のラウンドでは、5%にすでにバックアウトしたベッターの割合の50%に等しい確率で「バックアウト」します。(これは、第2ラウンドの初期のプレイヤーが撤退することで、瓦の中で大きなカスケード効果が得られることを意味することに注意してください。注意を払い、強盗が始まる前に崩壊する準備を整えてください。)
入力と出力
どちらのラウンドでも、プログラムにはコマンドライン引数として、正確にこの順序で次の情報が与えられます。特に明記しない限り、すべての値は小数を含まない整数です。
- 現在のゲーム番号(ゼロインデックス)
- 現在のゲームのラウンド数(1または2)
- 現在のゲームのプレイヤーの数(がれきを含む)。
- このラウンドですでにターンを取っているプレーヤーの数。
- これまでに肯定的な利害関係を持っているハイスターの数。(2回目のラウンドでは、これは実際には1回目のラウンドでバイインしたハイスターの総数になります。)
- これまでに投資したクレジットの総数。(第2ラウンドでは、これは実際には第1ラウンドで投資されたクレジットの合計数になります。特に、「オールイン」ハイスターの初期ステークス以上は含まれず、「バックアウト」のステークスが含まれます。ヘイスター。)
- 2回目のラウンドで確認した(つまり「バックアウト」しなかった)ヘイスターの数。これは最初のラウンドではゼロになります。
- 強要される銀行の(ゼロから始まる)番号(最初のラウンドでは、誰も賭けなかった場合に強盗される銀行)
- プレーヤーが現在利用できるクレジットの数。
- プレーヤーが最初のラウンドでベットしたクレジットの数。(これは最初のラウンドでは常にゼロです。)
- プレイヤーが各ゲームの終了時に給料で受け取るクレジットの数。
- プレーヤーが現在給料を受け取っている場合は1、失業者の場合は0
- 前のゲームの終了時点でのリーダーボードでのプレイヤーのランク(瓦を含まない)、1インデックス。(1+その時点でより多くのクレジットを厳密に持っているプレイヤーの数として定義されます。例えば、最初のゲームの間に、すべてのプレイヤーはランク1を持ちます。)
- すべてのプレーヤーが保持しているクレジットの平均数(瓦を除く)(10進数で表されます)
- すべてのプレイヤーが保持しているクレジット数の平均絶対偏差(瓦includingを除く)(10進数で表示)
- 任意のプレーヤーが保持するクレジットの最大数(つまり、ランク1プレーヤーが保持するクレジットの数(瓦を含まない))
- プレイヤーが銀行0口座に保存したクレジットの数
- 銀行1口座
- 銀行2口座
- 銀行3口座
- 銀行4口座
- バンク0でのプレイヤーの勝利の個々の確率
- 銀行1の確率
- 銀行2の確率
- 銀行3の確率
- 銀行4の確率
- 銀行0での成功した強盗に対するプレイヤーの個々の支払いオッズ
- バンク1オッズ
- バンク2オッズ
- 銀行3オッズ
- バンク4オッズ
ゲームの最初のラウンドでは、プレーヤープログラムは0からそのプレーヤーのアカウントのクレジット総数までの整数を標準出力に出力する必要があります。利用可能なクレジット残高を超えるベット額は最大ベットとみなされます。その他の出力(またはエラー状態)は、ゼロベットとして解釈されます。
ゲームの第2ラウンドでは、上記の「第2ベットラウンド」のセクションで説明したように、プレーヤープログラムは文字列を標準出力する必要があります。ここでのエラー状態は、デフォルトのアクションであると見なされます。通常通り、強盗で処理します。
コントローラ
トーナメントはこのコントローラーを使用して実行されます。ボットの例もあります。まだテスト中です。さらなるコード。(githubで)バグ修正を送信してください。ルールも変更されると更新されます。
自分のマシンで単一のトーナメントを実行するには、competitors.txtに行を追加してから使用します:
python bankheist.py 1000
コンテストのルール
- プレーヤーは、プログラムがコマンドライン引数を受け取る可能性のある自由に利用可能な言語で、プレーヤープログラムをいくつでも提出できます。
- 提出には、必要なツールの名前や発行する正確なコマンドなど、プログラムをコンパイルしてPCで実行する方法に関するかなり明確な指示を含める必要があります。提出には、プログラムを実行するコマンドを少なくとも1つ含める必要があり、コマンドライン引数を直接追加することができます。
- 提出物には、それらを識別するための一意の名前(スペースを含まない)も必要です。
- プログラムはかなり短い時間で実行する必要があります。(私は合理的なものに上限を設定していません。むしろ、スピードアップのために実行時間に余裕があると思われるエントリを作成者に単にアドバイスします。)
- プログラムはファイルを読み書きできません。また、実行間で情報を保存する他の方法を使用することもできません。この課題のポイントは、限られた/要約された情報に基づいて複雑な決定を下すことです。
- これらの規則はすべて、必要に応じていつでも変更される可能性があります。そのような変更を示すメッセージがこの投稿の上部に追加されます。
- このコンテストは、最後のユーザーが最初の投稿を投稿してから1週間以内に終了します。既存の提出物の変更は、コンテストが終了するまでいつでも許可されます。この投稿の上部にあるメッセージで、現在の締め切りが更新されるように最善を尽くします。
- このコンテストは、ルールが変更された場合、最後にルールが変更されてから1週間以内に終了します。ルールの変更の影響を受けるユーザーにコメントを残すように最善を尽くします。
- 私はこのコンテストに自分で参加することになります。;)