多項式時間での平均の推定


20

ましょう関数とすることが我々は、平均推定する。:つまり、。f:{0,1}n(2n,1]fE[f(n)]=2nx{0,1}nf(x)

NOTE: In the OP, the range of f was [0,1]. I changed this a bit for technical reasons. (This should simplify the problem; if not, forget it!)

レッツ(ランダム化された)推定アルゴリズムで。はへのブラックボックスアクセスがあると仮定します。これをます。EEfEf

2つの条件があります。

1)推定器の実行時間:すべてのおよびすべてのについて、の実行時間がによって制限されるような単一の多項式が存在します。p()nfEf(1n)p(n)E[f(n)]

自信を持って2)推定の精度:δ単一の多項式が存在する、全てのこのようなことはおよびすべての、我々が持っている少なくとも確率。q()nf1q(n)<Ef(1n)E[f(n)]<q(n)δ

NOTE: The confidence δ was not in the OP. The parameter δ is in (0,1), and may depend on n. For instance, it may be 1-1/2^n.

そのような推定量は存在しますか?

背景と動機

多くの背景知識を必要とするため、最初に動機について言及しませんでした。とにかく、愛好家のために、私はそれを簡単に説明します。そのような推定量の必要性は、以下の記事で定義されている「能力の証明」の文脈で生じます。

Mihir Bellare、Oded Goldreich。計算能力の証明、1992年。未発表の原稿。

具体的には、ページ5の下部で、著者はそのような推定量の存在を暗黙的に想定しています(精度についての言及はなく、実行時間は正確に定義されていませんが、コンテキストはすべてを明確に定義します)。

私の最初の試みは、「サンプラーのサンプル---サンプリングに関する計算の視点」を読むことでした。それは非常に似た問題に関係しますが、定義されたエラー確率は加法的ですが、私たちの問題は乗法的です。(私は論文を完全に読んでいませんでした、多分それは私がどこかで必要とするものに言及しています。)

編集(剛の要求による):実際、「計算能力の証明」の定義には、(予想される)実行時間がである「知識抽出」の存在が必要です。わからないので、推定したいです。しかし、これは実行時間を大幅に変更してはなりません。多項式ファクターまで変更する必要があります。精度条件は、そのような要件をキャプチャしようとします。p(n)E[f(n)]E[f(n)]


精度の条件がわかりません。アルゴリズムEが常に1を出力するのを妨げるものは何ですか?1 / q(n)<(真の値)/(推定値)<q(n)という意味ですか?
伊藤剛

p(n)= q(n)= O(1)および「1」を出力する自明なアルゴリズムが動作するはずです。実行時間はO(1)で、区切られています。また、精度は<= 1で、q(n)未満です。Ef(1n)p(n)E[f(n)]
ロビンコタリ

@ツヨシ&ロビン:すみません、私は精度の1つの条件を逃しました。今すぐチェックしてください!
MS Dousti

また、推定器はランダム化されていると思います(そうでなければ不可能に見えるからです)。これは事実ですか?また、もしそうなら、実行時条件と精度条件は正確に何を必要としますか?
伊藤剛

1
私は質問を明確に理解していないと思います。なぜチェルノフ限界のある素朴なサンプラーは良い推定量ではないのですか?
シルヴァンペロンネット

回答:


15

編集:これは、fが0または1のみを出力する問題のバージョンを解決します。しかし、より一般的なケースで動作するように解決策を適応させることができると思います。

たぶん私は質問を誤解したかもしれませんが、これはそれほど難しく見えません。

平均を推定する代わりに、1の数を推定して、その数をkと呼びましょう。してみましょう。したがって、平均はk / Nです。時間O(N polylog(N)/ k)の多項式乗算係数内でこれを推定します。N=2n

これは、任意の定数乗法因子内でも実行できると思います。たとえば、これを2倍以内に推定するとします。したがって、アルゴリズムの出力はk / 2〜2kの間になります。k

適切な実行時間を持つアルゴリズムをスケッチします。最初にkがN / 2とNの間にあるかどうかを確認します。これは簡単です。いくつかのランダムな値をサンプリングするだけで、1を半分以上超える場合はこの間隔になります。したがって、2つの近似値があります。そうでない場合は、N / 4とN / 2の間にあるかどうかを確認します。等々。間隔を小さくするたびに、kがその範囲内にあるかどうかを見積もるのに費用がかかります。しかし、コストは間隔がどれだけ小さいかに反比例します。

たとえば、kが間にあるかどうかをチェックしている場合 2 N / 2 qの、約 O 2 qクエリを作成する必要があります。とにかく、この手順を十分に繰り返した後、kが存在する間隔を取得する必要があります。kが N / 2 q 2 N / 2 qの間にあるとしましょう。この場合、kは約 N / 2 qです。だから 2 qN/2q2N/2qO(2q)N/2q2N/2qN/2q2q約k / Nです。したがって、このステップでは、O(k / N)クエリを使用します。しかし、このステップに到達するには他のqステップが必要でしたが、それは単なる余分なpolylog(N)要因です。したがって、全体の実行時間はO(N polylog(N)/ k)になります(2近似の場合)。

(実際には、各ステップで適切な精度を得るためにエラー増幅を行う必要があります。しかし、それは余分なポリログ要因です。)


このいくつかの段階のプロセスでそれを考えるのが好きな理由は、プロセスを推測およびチェックの手順として強調するからです。誰かがあなたに言った場合間にあるN / 2 、Q及び2 のn / 2 Q、あなたは束縛約束の時間に、この事実を知って、より良い精度にそれを見積もることができます。そのため、kの推測を与えるステップを排除する必要があります。これは、そのタイプの可能なすべての間隔でのバイナリ検索によって行われます。kN/2q2n/2qk

非ブール出力の場合にこれを機能させるには、1の数をカウントする代わりに、表示された値を合計するだけです。これが厳密に機能することを示すリファレンスを見つけようとします。


(1)関数fは非整数値を取る場合があるため、1の数の代わりに値の合計を使用することをお勧めします。(2)ステージごとに推定する必要がありますか?合計が固定多項式を超えるまで繰り返すだけで、これを単一の段階で行うことができると思います。質問への私のコメントも参照してください。
伊藤剛

ああ、範囲が[0,1]であることに気付きませんでした。{0,1}だと思った。しかし、私は同じ手順が機能すると思います。出力のバイナリ表現の特定の位置にある1の数を十分な精度で「カウント」できるため、1つの問題を他の問題に減らすことができるかもしれません。(2)については、あなたの手順は同等だと思います。それは推測とチェックのプロセスのように感じるので、このように考えます。つまり、kのお粗末な推定が与えられた場合、より良いものを取得します。これを回答に追加します。
ロビンコタリ

2つのアルゴリズムが本質的に同じであることに同意します。また、[0,1]および{0,1}に関しては、非整数値f(x)の各評価をコインフリップ(1 wp f(x)および0 wp 1-f(x))。
伊藤剛

@ロビン:答えてくれてありがとう。私にとっても不明瞭な点があります。「いくつかのランダムな値をサンプリングするだけで、半分以上の1が得られた場合は、この間隔になります。」これを定量化する必要があると思います。いくつのサンプルがどの程度の精度をもたらしますか?(OPを変更して、このような信頼性を考慮しました。そうしないと、必要なサンプラーを設計することができません!)
MS Dousti

@Sadeq:それはチェルノフの限界です。kがn / 2(公平なコインなど)であると予想される場合は、n(1 + eps)/ 2を超える範囲および下限についても同様に、末尾の境界をすばやく書き留めることができます。
スレシュヴェンカト

3

ましょうの値を示し、Fからの(置換を有する)のランダムサンプルを無限シーケンスに適用{ 0 1 } nは。ましょうkがこと以上の正の整数であるようなΣは、kをiは= 1を F IMいくつかの値のM、恐らくM = P O L Y L O G N 。推定量M /f1f2f{01}nk=1kfMMM=polylog(n)はあなたが望むことを成し遂げるべきです。M/k

分析では、チェルノフ境界をランダム変数直接適用することはできませんが、とにかくチェルノフを使用できるようにするためのコツがあります。してみましょうμ、未知の期待表すE Fを。定数検索のk L O Wをし、kはH I GのH(の関数μをので確率で少なくともように)1 - δ我々はΣのk個のLをoをW iは= 1 fがI < MΣ k個のHkμE(f)klowkhighμ1δi=1klowfi<M。これらのfiの合計は、チャーノフを使用して制限できます。その次のkLをoをW<K<KHIGのH少なくとも確率1-δしたがって推定M/kが十分に濃縮されています。i=1khighfi>Mfiklow<k<khigh1δM/k

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.