同じ試験を最短で受けることにより、すべての回答を正解する


11

雨は勉強しないので、はい/いいえの質問のみで構成されていても、中期には完全に無知です。幸い、Rainの教授は彼女が好きなだけ何度でも同じ中間学期を再受験することを許可していますが、彼はスコアを報告するだけなので、Rainは彼女が間違った問題を知りません。Rainは、最低限の回数の再受験ですべての正解を得るにはどうすればよいですか?

より正式に言えば、試験の合計は n はい/いいえの質問、その正解は X1,X2,,XniidBernoulli(0.5)。Rainが再受験する必要があると予想される回数を最小限に抑える戦略を見つけたいです。

しばらく考えていました。レインが初めて中期を取るとき、彼女のスコアは常にBinom(n,0.5)、彼女の答えに関係なく、各戦略は同じ量のエントロピーを減少させます。しかし、これが何を意味するのかはわかりません。ランダムな推測がすべて「はい」またはすべて「いいえ」で答えるのと同じくらい良いということですか?

これは宿題ではありませんが、次の研究プロジェクトをベースに計画しているので、

  1. 本格的な答えの代わりにいくつかのヒントを提供してください。
  2. この質問にすでに回答している場合は、ポインタを教えてください。

言及していない他のパラメーターがない限り、分布は二項n 0.5ではありません。それは彼女の最初の賭け戦略(それに直面しよう、これはゲーム理論の問題です)と正解の分布に依存します。1つのアプローチは、最初のパスですべての質問に対して「いいえ」と答えることです。実際の正解は、すべての質問に対して「いいえ」である場合があります。
AdamO

@bounty / Martijn /少しメタ:わかりません-なぜその質問はあまり注意を払っていないのですか?まず、これは「ゲーム理論」からのよく知られた問題であり、いくつかの特定の解決策があります。第二に、なぜ最良の答えは報奨金と同じ人物からのものであるかです(私は実際にはあまり多くの指摘を気にしません)。しかし、とにかく、OTからの実際の質問に答えられるかどうかはわかりません。ゲーム自体の状態と影響についてはまだオープンなものがあるようです。
ケルビム

@cherub評判スコアを取り除こうとしています。私は実際には数十の質問に賞金を投じたかったのですが、3つだけで行き詰まりました。
Sextus Empiricus

回答:


4

これはゲームMastermindに似ています。

このトピックに関する文献はたくさんあります。この特定のケース(6つのオプションごとに4つの質問)の場合、テイクの平均数を4.3を少し超えるようにするいくつかの戦略が考案されています。

これらの戦略の1つを選択するか、新しい戦略を作成して、それを n との質問 2オプション、これはあなたの状況です。質問が広すぎるため、ここで詳細な回答を提供できません。


4

これは、未知のものを見つけようとする最適化問題です n推測からの2桁の2進数。これらの推測からのフィードバックは、正しい数字の数を受け取ることです。これは、本質的には単なるバイナリMastermindであり、「ブラックボックス最適化」と呼ばれる計算問題でも調べられます(たとえば、Doerr et al 2001を参照)。


4

他の人が言ったように、問題はゲームの首謀者と非常に似ています。正しい答えがバイナリ変数であると仮定しますci ために i=1,,n そしてその雨はテストを受ける k 時々 j 答える xi,ji-番目の質問(in,jk)。に対する完全な正解j-回目は Tj

以下は、問題についてのヒントのみを提供するというOPの明示的な要求に基づく、いくつかの観察と注記です。

  1. 簡単な「情報理論的」下限が k 正解の一般的な構成は kO(n/logn):各テストはRainに数値を提供します 0Tjn、これは logn 知識のビット、すべての答えを知るために必要な知識は〜ですn (ので n バイナリの質問)。

  2. 一般的なケースでは、変数を定義できます ziY そして ziN することが 0 または 1 それぞれの場合 i-番目の正解は「はい」または「いいえ」です。このようにして問題は、次元の「離散的な」線形空間で正解のポイントを決定することです。 2n:上記の変数の定義によって制約があることを考慮する理由を確認する

    ziY+ziN=1

    さらに、あなたの j-試験を受けて、そのような変数の線形結合をテストしていて、それらの合計が Tj

    i=1nziY/N=Tj

    これは、そのような問題を解決するのは簡単であることを強調しています n テストを受けることによってクエリ k あなたが持っている時間 n+k の点を定義する方程式 2n 次元空間。冗長なクエリを作成しないほど賢い場合(一度に1つずつ回答を変更するだけ)は、 n 回クイズ。

  3. 特定の場合(はい/いいえの比率が特に不均衡である場合など)は、特に適したヒューリスティックを簡単に思い付く必要があります。あなたはそれをちょうどで見つけることができますlogn回答セットの標準二分法によるクエリ。さらに、「すべてはい」の最初のクエリを発行することで、そのような場合かどうかを確認できます(その場合)T1=1)。

  4. 前の箇条書きのアイデアを一般化することにより、はいの回答の数が CCn/2)(これは単一のクエリで認識される可能性があります)、基本的に一連のサイズを検索しています C サイズセット内 n (したがって、 (nC)nC それらの)そしてあなたのクエリは1つのセットの交差のカーディナリティを知ることにあります S 上記の一連の「はい」の質問を選択することで、はるかに研究された問題であり、おそらく多くの参考文献を見つけることができると思います。

    探しているセットに電話してください(はい) Y。単一のクエリでそのカーディナリティを知ることができます|Y|=m。今ランダムに選択されたセットS クエリとして使用すると、2つのサブセットの基数を知ることができます |YS|=t そして |YSc|=mt、および元の問題は、サイズが約半分の2つのサブ問題に削減されました(求められる「はい」の回答の数は、通常、各反復で半分になります)。私は明確な詳細を書きませんが、それは単純な確率計算の問題です。

    上記の観察を利用して、サブ問題を解決する確率的アルゴリズムを考え出す必要があります P(m,n)≃≤1+2P(m/2,n/2)、あなたはあなたの限界を得るはずです O(mlogn)。そのような問題の決定論的アルゴリズムを考え出すことは、期待を最大化する手法を使用して行うことができますが、それが機能するかどうか予測できません。


2

再受験の最大数を最小化しますか?予想される再受験回数を最小限に抑えますか?

どちらを見たいかに応じて、非常に異なる戦略を考え出すことができます。

最初の素朴なアプローチでは、 n+1時間と最初にテストを受けることで構成され、2回目にテストを受けると最初の回答のみが変更されます。スコアが上がった場合は新しい回答を維持し、下がった場合は将来すべての最初の回答に戻りますステップ。3回目(2回目の再受験)では、2回目の解答のみを変更します。

これで、他の戦略をその戦略と比較することができます。テストを受ける2回目に2つの回答が変更された場合、スコアが変更されると、2つの質問の正解がわかってステップが保存されますが、1つを正解に変更し、もう1つを間違えた場合、スコアは変更されます変更せず、どちらか1つだけを変更して3回目の試験を受けるまで、どちらの変更が正しかったかわかりません(ただし、どちらか一方についても通知されます)。そのため、1または2回再受験して2つの回答を得ます(50%予想される再受験回数は減りますが、最大値は同じに保つ可能性があります。

これで、他の戦略を見て、それらを比較する方法を確認できます(最初の3つの回答を変更し、最初の回答を変更してください) n2など)。


ヒントをありがとう!私のお金は最初のものを変えることですn2これにより、最初と2回目の再受験の相関が最小限に抑えられます。しかし、それを検証するためにいくつかの計算を行います。
nalzok
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.