タグ付けされた質問 「st.statistics」

1
値を明らかにせずに分散ノード間のパーセンタイルを推定する
この質問は、Theorytical Computer Science Stack Exchangeで回答できるため、Cross Validatedから移行されました。 8年前に移行され ました。 解決すべきかなりユニークな問題があり、ここで誰かがそれをどうやってうまくやるのかについての洞察を与えてくれることを望んでいます。 問題:単一の参加者が共有する番号を実際に知らないような方法で、N個の番号のリストが参加者セット間で共有されているとします。すべての参加者は、N(数値のリストのサイズ)とリスト上のすべての数値の合計を知っていますが、先験的なことは何も知りません。 一緒に作業することにより、参加者が「a <b」という文が真であるかどうかを学習するように、2つの共有番号aとbを比較できますが、それ以上はできません。ただし、これは非常に高価です(1回の比較を完了するのに数秒、場合によっては数分かかることがあります)。そのようなことがどのように可能かについてのもう少しの情報については、この投稿の終わりを見てください。 一日の終わりに、当事者は、リスト内のどのインデックスを、リスト内の「上位Kパーセント」(最大のK%)共有番号に対応させるかを出力します。もちろん、これはソートするか、「トップK」選択アルゴリズムを使用して実行できます。ただし、これらは非常に多くの比較を使用する傾向があるため、回避する必要があります。(これらは、O(n log n)またはO(n)のいずれかで、かなり大きな隠し定数があります。) 別の選択肢は、(1-K)%がXより小さく、K%が大きい数値Xでの「推測」です。次に、各要素をXと比較して、どれだけ大きいか、小さいかを確認できます。推測が間違っていた場合は、正しいソリューションに収束するまで、バイナリ検索などを使用して修正します。推測が正しければ、比較にかかる時間ははるかに少なくなります。 だから、私の質問は、 Nと合計のみを考えると、Xを「予測」する最良の方法は何ですか? もちろん、これは基礎となるディストリビューションに依存します。さまざまなユースケースでは、基礎となる分布は異なる可能性がありますが、既知であるため、すべての一般的なもの(通常、均一、指数関数、おそらくいくつか)の優れたソリューションに興味があります。また、基礎となる分布についての仮定を前提として、「バイナリのような」検索を実行してステップ数を最小限に抑える最善の方法に関する提案を聞きたいと思います。 付録:リストの各値は、Shamirの秘密共有スキームを使用して参加者間で共有されます。仮定M参加者が存在すると、リストは、リスト上のi番目の数は多項式で表現され、そして長さNであり、いくつかの有限体Fの一定期間にわたり度M-1のfはiが数であります共有されていることを、他のすべての係数はj番目の参加者の株式は次いで、F.からランダムに一様に選択されるfをI(J )、1 ≤ I ≤ Nf私f私f_if私f私f_if私(j )f私(j)f_i(j)1 ≤ I ≤ N1≤私≤N1\leq i\leq N。この共有を考えると、参加者はその番号に関する情報を(情報理論的には)持っていません。実際、参加者の適切なサブセットでは、知識を組み合わせて共有番号に関する情報を学習することはできません。ただし、高度な安全なマルチパーティ計算手法を使用すると、情報を公開せずに、ある共有値が別の共有値よりも小さいかどうかを判断できます。この手法では、すべての参加者が協力する必要があります。そのため、実行するのに費用がかかるため、できる限り少ない回数で実行する必要があります。

2
信念伝播法の実行時間の理論的保証?
確率伝播は、確率的グラフィカルモデルの研究を通じて非常に強力な方法であることが示されています。 ただし、BPについては#P完全問題の完全な多項式ランダム化近似スキーム(FPRAS)を使用できるMCMCメソッドに匹敵するものは何も知りません。 誰かが私にいくつかの参考文献を教えてくれますか?

4
ノルムで近さをテストする
次の問題で既知の下限(サンプルの複雑さ)があるかどうか疑問に思っていました。 2つの未知の分布に与えられたサンプルのOracleアクセス、に、テスト(WHP)かD1D1D_1D2D2D_2{1,…,n}{1,…,n}\{1,\dots,n\} D1=D2D1=D2D_1=D_2 またはd2(D1,D2)=∥D1−D2∥2=∑ni=1(D1(i)−D2(i))2−−−−−−−−−−−−−−−−−−√≥ϵd2⁡(D1,D2)=‖D1−D2‖2=∑i=1n(D1(i)−D2(i))2≥ϵ\operatorname{d_2}(D_1,D_2)=\lVert D_1-D_2\rVert_2 = \sqrt{\sum_{i=1}^n\left(D_1(i)-D_2(i)\right)^2} \geq \epsilon バトゥ等。[BFR + 00]は、O(1ϵ4)O(1ϵ4)O\left(\frac{1}{\epsilon^4}\right)サンプルで十分であることを示しましたが、下限について言及していません。 私は、この問題に対して公平と\ epsilonバイアスのコインを区別するタスクを減らすことにより、Ω(1ϵ2)Ω(1ϵ2)\Omega(\frac{1}{\epsilon^2})下限を常に表示できると考えています(2つだけでサポートされる分布のシミュレーションポイント、およびiidコインの投げに応じてテスターのクエリに答えます)が、それでも2次ギャップが残ります...ϵϵ\epsilon (私が興味を持つ別のポイントは、このL_2距離を推定する際の下限(追加のϵϵ\epsilon)です—繰り返しますが、そのような結果への参照は文献で見つかりませんでした)L2L2L_2 ご協力いただきありがとうございます、

1
量子状態の区別
量子状態所与のセットからランダムに一様に選択されたNの混合状態がρ 1。。。ρ N、正しく特定の最大平均確率ものでAは?ρAρA\rho_ANNNρ1...ρNρ1...ρN\rho_1 ... \rho_NAAA この問題は、区別の問題考慮することによって、2つの状態識別性の問題に変えることができるからρ B = 1ρAρA\rho_A。ρB=1N−1∑i≠AρiρB=1N−1∑i≠Aρi\rho_{B} = \frac{1}{N-1}\sum_{i\neq A}\rho_i 2つの量子状態について、平均エラー確率を最小化するのではなく、最大エラー確率を最小化した場合の状態間のトレース距離の点で問題が良い解決策を持っていることを知っています。この場合。もちろん、POVMを介した最適化の観点から確率を記述することは可能ですが、最適化が既に実行されているものを期待しています。 量子状態の識別可能性に関する膨大な文献があることを知っており、この数日間、この質問の答えを見つけようとして多くの論文を読んでいますが、これに対する答えを見つけるのに苦労しています問題の特定のバリエーション。文学のほうが時間を節約できることを知っている人に期待しています。 厳密に言えば、正確な確率は必要ありませんが、良い上限は必要です。ただし、任意の1つの状態と最大混合状態との違いは非常に小さいため、その制限では境界が役立つ必要があります。


1
回路の複雑さと統計テスト
数年前、私はスティーブン・ルディッチから複雑性理論のクラスを受講しました、そして彼が統計的テスト(統計部門で見られるような!)を回路の複雑さと結びつける興味深い講義をしたことを覚えています。私は彼が漠然と何かを主張したのを覚えています:回路を使用して統計的検定が何であるかを抽象的に特徴付けることができ、統計的検定が識別できるパターンの種類に基本的な制限があったことです。 残念ながら、私は彼の主張が何であったかを正確に覚えていません。誰かが彼が何を意味しているのかを知っていて、いくつかの参照を私に提供していますか? (この質問のあいまいさに対する私の謝罪:正確に尋ねるのに十分知っていれば、私は尋ねる必要はありません!)

2
モデルをデータに適合させる複雑さ
仮定いくつかの連続関数であり、いくつかのf:R × R → Rf:R×R→Rf:\mathbf{R}\times \mathbf{R} \to \mathbf{R} バツ1… xんx1…xnx_1 \ldots x_nは実際の値のセットであり、計算したい アーグミンaΣ私f(a 、x私)argmina∑if(a,xi)\text{argmin}_a \sum_i f(a,x_i)を規定の精度に さまざまなfについてこの問題の難しさについていくつかの結果はありますか? たとえば、と仮定します。問題の最小値は、計算が容易なxの平均です。一方、と仮定すると、閉形式の解はないため、argminの計算が難しいように見えますか、それともそうですか? f (m 、x )= log (1 + exp (− m x ))f(m 、x )= (m − x )2f(m,x)=(m−x)2f(m,x)=(m-x)^2f(m 、x )= ログ(1 + exp(− m x ))f(m,x)=log⁡(1+exp⁡(−mx))f(m,x)=\log (1+\exp(-m x)) 動機:この最小化の問題は、モデルをデータに適合させるときに発生します。fの最初の例は最小二乗近似で、2番目の例はロジスティック回帰です。 編集:私は関連する質問を見ただけであり、それは私が求めていたものの精神であり、特定のfを選択するためのものです
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.