「最大限」テストするのが難しい分布特性はありますか?


13

分布特性P([N]上のすべての分布のちょうどいくつかのサブセットである)のためのアルゴリズムを試験分布は、いくつかの分布Dに従ってサンプルへのアクセスを許可され、そして場合(WHP)を決定するために必要とされるDPまたはd(D,P)>ϵdここでは、通常、1距離)。複雑さの最も一般的な尺度は、アルゴリズムで使用されるサンプルの数です。

現在、オブジェクトへのクエリアクセスがある標準のプロパティテストでは、クエリの複雑さの線形下限は、可能な限り最も強い下限です。これは、nクエリがオブジェクト全体を明らかにするためです。これは配布テストにも当てはまりますか?

私の知る限り、分布の特性をテストするための「自明な」上限はO(n2logn) --- Chernoff境界により、これはDに近い分布D 'を「書き留める」のに十分です1の距離、およびそこに近いPであるD」に任意の分布である(これは無限の時間がかかる場合がありますが、これはサンプルの複雑さとは無関係である)場合、我々は単に確認することができます。

  • すべての分布プロパティに対してより良い「簡単な」テストはありますか?
  • サンプルの下限が線形よりも強いことがわかっている分布特性はありますか?

複雑さのクラス分離を証明することに似ているようで、既知の未解決の問題に近い可能性があります...?
vzn

ただ、これを見て...私は非常にあなたがバインドされた派生方法はないです、実際に(サイズのドメイン上のディストリビューションを学ぶことが、ノートのn TV /に)1つの距離εの確率で2 / 3は、実際に行うことができ、O N / ε 2サンプル(これはタイトです)。したがって、近接パラメータεの非定数値を見ている場合を除き、ω n )の下限を取得する希望はありません...O(n2logn)n1ε2/3O(n/ε2)εω(n)
クレメントC.

回答:


5

この記事を発掘してすみません-それはかなり古いですが、私はそれを答えさせることはそれほど悪い考えではないかもしれないと思いました。

最初に、パラメータを少し奇妙に設定してChernoffバウンドを実行したように見えます。(またはアプローチをご提案「学習によってテスト」を実行するために、全変動距離に分布を学ぶのに十分であることに注意してくださいあなたが好む場合は係数2に同じアップである、)距離にε1。(それ自体が最大でεの距離にある特性Pnを持つ分布p'がある場合、「オフライン」をチェックする前にε2pPnあなたの学んだ仮説からのp)。これは単純にOnlognε2p^上部このアプローチのために結合したサンプルの複雑。ただし、距離ε(変動幅の合計)までのサイズnのドメインでの任意の分布の学習は、OnO(nlognε2)nεサンプル(これはタイトです)。O(nε2)

したがって、ベースラインは実際には、リニア既にあるN。さて、次の質問をすることができます-ドメインサイズnの線形依存性がテスト(たとえば、定数ε)に必要な「自然な」プロパティはありますか?O(nε2)nεn

答えは(私が知る限り)「まったくではなく、近い」です。すなわち、分布の特性(又は等価的に、寛容性試験)、ヴァリアントとヴァリアントの結果を推定する上での作業の重要ラインを下記(STOCS'11、FOCS'11、およびいくつかの他のもの)を意味するものではなく考案プロパティは、「あることを「均一に-closeサンプル複雑有するΘのεnは1/10Θε(nlogn)

(プロパティは、単に寛容なテストの質問を取り、アドホックプロパティのテストとして再ラベル付けする方法であるという意味で、少し「ごまかし」であることに注意してください)。

それがあなたの渇きを完全に癒すのに十分でない場合、「ヒストグラムである」という(自然?)特性(k個の未知の区間の集合で区分的に定数ですか?)、k =たとえば、n / 10Ω nkkk=n/10下限(2016年からの私の論文にあります;下限は、Valiantsの結果へのかなり単純な減少から続きます)。さて、あなたが「nであることを検討するかどうかΩ(nlogn) -histogram」は自然の特性であるためにあなた次第です。n100

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.