統計とビッグデータ consistency

3

誰もこれをすでに尋ねていないように見えることに本当に驚いています... 推定量について議論するとき、頻繁に使用される2つの用語は「一貫性のある」と「不偏」です。私の質問は簡単です：違いは何ですか？これらの用語の正確な技術的定義はかなり複雑であり、その意味を直感的に理解することは困難です。良い評価者と悪い評価者を想像できますが、どの評価者がどのように一方の条件を満たし、もう一方の条件を満たさないかを見るのに苦労しています。

125 unbiased-estimator estimators consistency

1

統計が滑らかな場合にのみ、ブートストラップが有効であるという結果がありますか？

全体を通して、統計量θ(⋅)θ(⋅)\theta(\cdot)は、分布関数Fから得られるデータ関数であると仮定します。サンプルの経験的分布関数はです。したがって、は確率変数として表示される統計であり、は統計のブートストラップバージョンです。KS距離としてを使用しますX1,…XnX1,…XnX_1, \ldots X_nFFF θ（F）θ（ F）Dを∞F^F^\hat{F}θ(F)θ(F)\theta(F)θ(F^)θ(F^)\theta(\hat{F})d∞d∞d_\infty 統計が単純な線形統計である場合、ブートストラップの有効性に対して「if and only if」結果があります。たとえば、Mammenの定理1「ブートストラップはいつ機能しますか？」もしいくつかの任意の機能のためのHNことその後ブートストラップは意味で動作するD∞[L（θ（ F） - T N）、L（θ（F）-TN）]→P0が存在する場合にのみσNおよびTNとなるようにθ(F)=1n∑ni−1hn(Xi)θ(F)=1n∑i−1nhn(Xi)\theta(F) = \frac{1}{n} \sum_{i-1}^n h_n(X_i)hnhnh_nd∞[L(θ(F^)−t^n),L(θ(F)−tn)]→p0d∞[L(θ(F^)−t^n),L(θ(F)−tn)]→p0d_\infty\big[\mathscr{L}(\theta(\hat{F})-\hat{t}_n), \mathscr{L}(\theta(F)-t_n)\big] \underset{p}{\rightarrow} 0σnσn\sigma_ntntnt_n 我々は定義することができる ^ T N我々のサンプルの一部機能として、T N = E（T N）d∞[L(θ(F)−tn),N(0,σ2n)]→p0d∞[L(θ(F)−tn),N(0,σn2)]→p0d_\infty\big[\mathscr{L}(\theta(F)-t_n), N(0, \sigma_n^2)\big]\underset{p}{\rightarrow} 0tn^tn^\hat{t_n}tn=E(t^n)tn=E(t^n)t_n = \mathbb{E}(\hat{t}_n) また、Politis RomanoとWolfによるSubsamplingの定理1.6.3など、一般的な統計に対してブートストラップが機能するより一般的な結果もあります。は、有限のサポートを持つすべての分布のクラスから引き出されると仮定します。統計量θ （⋅ ）がFで極値ノルムに関して微分可能であり、微分g Fが0 < Var F [ g F（x ）] < ∞を満たすと仮定します。次に、θ （F …

25 probability mathematical-statistics bootstrap asymptotics consistency

1

一貫性のない推定量は望ましいでしょうか？

一貫性は明らかに自然で重要なプロパティ推定器ですが、一貫性のある推定器よりも一貫性のない推定器を使用したほうがよい場合がありますか？より具体的には、すべての有限（適切な損失関数に関して）に対して妥当な一貫性のある推定器よりも優れた一貫性のない推定器の例はありますか？nnn

22 estimation consistency

2

強い整合性が必要な統計アプリケーションはありますか？

誰かが知っているのか、または弱い一貫性の代わりに推定量の強い一貫性が必要な統計のアプリケーションがあるのか疑問に思っていました。つまり、アプリケーションには強い整合性が不可欠であり、アプリケーションは弱い整合性では機能しません。

20 hypothesis-testing theory asymptotics estimators consistency

3

ゼロ以外の漸近的分散を持つ漸近的整合性-それは何を表していますか？

この問題は以前に発生しましたが、それを明確にする（そして分類する）答えを引き出すことを試みる特定の質問をしたいと思います。「Poor Man's Asymptotics」では、（a）確率が定数に収束する一連のランダム変数対照的に（b）確率が確率変数に収束する（したがって分布する）確率変数のシーケンス。しかし、「賢者の漸近」では、次の場合もあります。（c）限界で非ゼロの分散を維持しながら、確率が定数に収束するランダム変数のシーケンス。私の質問は次のとおりです（以下の自分の探索的回答から盗みます）：どのように我々は漸近的に一致しているが、推定理解することができますまた、非ゼロ、有限の分散を持っているの？この差異は何を反映していますか？その動作は、「通常の」一貫した推定量とどのように異なりますか？（c）で説明されている現象に関連するスレッド（コメントも参照）：一貫性のある推定量と公平な推定量の違いは何ですか？ /stats/120553/convergence-of-an-estimator-with-infinite-variance 漸近的に整合性のある推定器が無限大でゼロ分散を持たないのはなぜですか？収束と制限分散がほぼ確実にゼロになる

18 mathematical-statistics variance convergence asymptotics consistency

1

推定量が一貫していることを示す方法は？

MSE = 0をとして表示するだけで十分ですか？私はメモでプリムについても読みました。plimを見つけてそれを使用して、推定量が一貫していることを示すにはどうすればよいですかn→∞n→∞n\rightarrow\infty

17 estimation convergence consistency

4

なぜ一貫性を保つために推定量が必要なのですか？

一貫した推定量の数学的定義はすでに理解していると思います。私が間違っている場合は修正してください： WnWnW_n場合、は一貫した推定量ですθθ\theta∀ϵ>0∀ϵ>0\forall \epsilon>0 limn→∞P(|Wn−θ|>ϵ)=0,∀θ∈Θlimn→∞P(|Wn−θ|>ϵ)=0,∀θ∈Θ\lim_{n\to\infty} P(|W_n - \theta|> \epsilon) = 0, \quad \forall\theta \in \Theta ここで、ΘΘ\Thetaはパラメトリック空間です。しかし、私は推定量が一貫している必要性を理解したいと思います。一貫性のない推定量が悪いのはなぜですか？例を挙げていただけますか？ Rまたはpythonでのシミュレーションを受け入れます。

15 estimation consistency

1

一貫性のある推定量の定義がそのままなのはなぜですか？一貫性の代替定義についてはどうですか？

ウィキペディアからの引用：統計では、一貫性の推定又は漸近一致推定は、パラメータの計算推定のための推定ルールであるθ∗θ∗θ^*データポイントの数と、無期限に確率の推定値が収束の結果のシーケンスを増加を使用したこと特性を-having θ∗θ∗θ^*。このステートメントを正確にするには、推定する真のパラメーターの値をθ∗θ∗\theta^*とし、データの関数としてこのパラメーターを推定するためのルールをθ^(Sn)θ^(Sn)\hat\theta(S_n)とします。次に、推定量の一貫性の定義は次のように表現できます。 limn→∞Pr[|θ(Sn^)−θ∗|≥ϵ]=0limn→∞Pr[|θ(Sn^)−θ∗|≥ϵ]=0\lim_{n \to \infty} Pr[|\hat{\theta(S_{n}}) - \theta^*|\geq \epsilon ]=0 私の質問は一見表面的なようだが、それは次のとおりです。なぜ単語「一貫性/整合性は、」推定のこの振る舞いを記述するために使用されたのですか？私がこれを気にする理由は、私にとって、直感的に一貫性という言葉は異なるものを意味するためです（少なくとも、私にとっては異なるように見えますが、等しいことを示すことができるかもしれません）。例を使用して、その意味を説明します。「あなた」は一貫して「良い」（何らかの良い定義について）、そして一貫しているということは、あなたが良いことを証明/示す機会があるたびに、あなたが本当に良いことを毎回本当に証明することを意味します（または少なくともほとんどの時間）。直観を適用して、推定量の一貫性を定義します。"you"をθ^θ^\hat{\theta}を計算する関数とし、 "good"が真の推定値\ theta ^ *からどれだけ離れているかを意味しますθ∗θ∗\theta^*（良い、l1l1l_1意味で、そうではありません）。一貫性のより良い定義は次のとおりです。 ∀n,∀Sn,Pr[|θ(Sn^)−θ∗|≥ϵ]<δ∀n,∀Sn,Pr[|θ(Sn^)−θ∗|≥ϵ]<δ\forall n,\forall S_n, Pr[|\hat{\theta(S_{n}}) - \theta^*|\geq \epsilon ] < \delta 一貫性の定義としてはあまり有用ではないかもしれませんが、推定器θ^θ^\hat\thetaに投げるトレーニング/サンプルセットについては、一貫性を定義する方法のほうが理にかなっています。良い仕事です。つまり、私は一貫してうまくやるでしょう。すべてのn（おそらく不可能）に対してそれを行うのは少し非現実的ですが、次のように言ってこの定義を修正できます。 ∃n0,∀n≥n0,∀Sn,Pr[|θ(Sn^)−θ∗|≥ϵ]<δ∃n0,∀n≥n0,∀Sn,Pr[|θ(Sn^)−θ∗|≥ϵ]<δ\exists n_0, \forall n \geq n_0,\forall S_n, Pr[|\hat{\theta(S_{n}}) - \theta^*|\geq \epsilon ] < \delta すなわち、nが十分に大きい場合、推定器は真のから（つまり、「真実」から超えない）より悪くなることはありません（は少なくとも必要な直感をキャプチャしようとしています何かを学習/推定するためのいくつかの例があり、その数に達すると、推定者が定義しようとしている方法に一貫性がある場合、推定者はほとんどの場合うまくいきます）。ϵϵ\epsilonϵϵ\epsilonθ∗θ∗\theta^*n0n0n_0 ただし、前の定義は強力であり、サイズほとんどのトレーニングセットでから遠ざかる可能性を低くすることができます（つまり、すべてのでこれを必要としませんが、またはそのようなものの分布）。そのため、ほとんどのサンプル/トレーニングセットで高いエラーが発生することはほとんどありません。θ∗θ∗\theta^*n≥n0n≥n0n \geq n_0SnSnS_nSnSnS_n とにかく、私の質問は、「一貫性」のこれらの提案された定義は実際に一貫性の「公式」定義と同じですか、しかし等価性を証明するのは難しいですか？証拠を知っているなら、それを共有してください！または、私の直感は完全にオフになっていますか？通常定義されている方法で定義の一貫性を選択するより深い理由がありますか？なぜ（「公式」）一貫性がそのように定義されているのですか？ある種の同等性の証明候補、または私の一貫性の概念と受け入れられている一貫性の概念の類似性についての私の考えのいくつかは、制限の定義。しかし、私はその方法を100％確信していませんでしたが、一貫性の公式定義では、すべての潜在的なトレーニング/サンプルセットについて話すことを考慮していないようです。私はそれらが同等であると信じているので、私が提供した公式の定義は不完全ですか（つまり、私たちができるデータセットまたはサンプルセットを生成できるすべての異なるデータセットについて話さないのはなぜですか）？(ϵ,δ)−(ϵ,δ)−(\epsilon, …

14 machine-learning mathematical-statistics consistency

2

一貫性のない最尤推定量の例

私は論文へのコメントを読んでおり、著者は、推定量（MLまたは最大準尤度によって検出された）が一貫していない場合でも、尤度比または準尤度比検定の力はまだ収束する可能性があると述べています1観測されたデータの数が無限になる傾向があるため（テストの一貫性）。これはいつどのように起こりますか？いくつかの参考文献を知っていますか？

13 mathematical-statistics references inference power consistency

1

漸近的不偏性と一貫性の違いは何ですか？

それぞれが他を暗示していますか？そうでない場合、一方は他方を意味しますか？なぜ/そうでないのですか？この問題は、私がここに投稿した回答に対するコメントへの応答として生じました。関連する用語をグーグル検索しても、特に役立つと思われるものは何も生成されませんでしたが、数学のスタック交換に関する回答に気付きました。しかし、この質問はこのサイトにも適切だと思いました。コメントを読んだ後に編集する math.stackexchangeの回答と比較して、コメントスレッド@whuber linkedで扱われた問題のいくつかをカバーするために、私はより深い何かを求めていました。また、私が見ているように、math.stackexchangeの質問は、一貫性が漸近的に公平であることを意味するのではなく、理由について何かを説明していません。そこのOPも当然のことながら、漸近的な不偏性は一貫性を意味するものではないため、これまでのところ唯一の回答者はこれがなぜであるかについては触れていません。

12 mathematical-statistics bias unbiased-estimator estimators consistency

2

NBA射撃の一貫性の計算

NBAプレーヤーの3点射撃の一貫性を評価/決定する適切な方法は何でしょうか？たとえば、3ポイントの範囲から37％を発射し、年間200回の試行を行うプレーヤーがいます。私は、任意の数のショット（たとえば20）のローリング平均3ポイント％を取ることを検討していました。次に、それらの平均を使用して、37％の平均からの標準偏差を決定します。20ショットのローリングサンプルサイズを使用した場合、精度は5％のパーセンテージでしか許容されませんが、あまり多くのショットを使用してもパフォーマンスの不一致が明らかにならないのではないかと心配しています。一貫性を判断するためのより良いアプローチはありますか？

10 standard-deviation consistency

1

非フリーランチ定理とK-NNの整合性

計算学習では、NFLの定理は普遍的な学習者は存在しないと述べています。すべての学習アルゴリズムについて、学習者に大きな確率で高い確率で仮説を出力させる分布があります（ただし、低い誤差仮説はあります）。結論は、学習するためには、仮説クラスまたは分布を制限する必要があるということです。彼らの著書「パターン認識の確率論」では、Devroyeらは、K最近傍学習者のために次の定理を証明している： μ に密度があるAssume μ has a density. if k→∞ and k/n→0 then for every ϵ>0, there's N, s.t. for all n>N:P(Rn−R∗>ϵ)<2exp(−Cdnϵ2)Assume μ has a density. if k→∞ and k/n→0 then for every ϵ>0, there's N, s.t. for all n>N:P(Rn−R∗>ϵ)<2exp(−Cdnϵ2)\text{Assume } \mu \text{ has a density. if } k\to \infty \text{ …

10 k-nearest-neighbour consistency

1

root-nの一貫した推定量ですが、root-nは収束しませんか？

「root-n」の一貫した推定量という用語が何度も使われることを聞いたことがあります。私が指示したリソースから、「root-n」の一貫した推定量は次のことを意味していると思いました。推定器は真の値に収束します（したがって、「一貫性」という言葉）推定量はレートで収束し1 / n−−√1/n1/\sqrt{n} は収束しないので、これは私を困惑させますか？ここで重要な何かを見逃していますか？1 / n−−√1/n1/\sqrt{n}

10 convergence estimators consistency

2

最小二乗仮定

次の線形関係を仮定：ここで、Y iは従属変数であり、X I単一の独立変数及びU I誤差項。Yi=β0+β1Xi+uiYi=β0+β1Xi+uiY_i = \beta_0 + \beta_1 X_i + u_iYiYiY_iXiXiX_iuiuiu_i Stock＆Watson（計量経済学入門; 第4章）によると、3番目の最小二乗の仮定は、とu iの4次モーメントは非ゼロで有限（0 < E （X 4 i）< ∞ および 0 < E （u 4 i）< ∞ ）。XiXiX_iuiuiu_i(0<E(X4i)<∞ and 0<E(u4i)<∞)(0<E(Xi4)<∞ and 0<E(ui4)<∞)(0<E(X_i^4)<\infty \text{ and } 0<E(u_i^4)<\infty) 3つの質問があります。私はこの仮定の役割を完全には理解していません。この仮定が成り立たない場合、または推論にこの仮定が必要な場合、OLSは偏っており、矛盾していますか？ストックとワトソンは、「この仮定は、またはu iの非常に大きな値で観測値を描画する確率を制限します。」と書いています。しかし、私の直感では、この仮定は極端です。外れ値が大きい場合（4次モーメントが大きい場合など）に問題がありますが、これらの値がまだ有限である場合はどうでしょうか。ところで、外れ値の根底にある定義は何ですか？XiXiX_iuiuiu_i これを次のように再定式化できますか：「とu iの尖度は非ゼロで有限ですか？」XiXiX_iuiuiu_i

9 regression least-squares assumptions bias consistency

1

EMアルゴリズムはガウス混合モデルのパラメーターを一貫して推定しますか？

私は混合ガウスモデルを研究していて、この質問を自分で考えます。 KKKμk∈Rpμk∈Rp\mu_k\in\mathbb{R}^p1≤k≤K1≤k≤K1\leq k\leq KΣΣ\SigmaΣΣ\Sigma1/K1/K1/K KKKμk∈Rpμk∈Rp\mu_k\in\mathbb{R}^p1≤k≤K1≤k≤K1\leq k\leq KΣΣ\Sigma μkμk\mu_kΣΣ\Sigman→∞n→∞n\rightarrow\inftyμkμk\mu_kΣΣ\Sigma

9 self-study expectation-maximization gaussian-mixture consistency

タグ付けされた質問 「consistency」

タグ付けされた質問「consistency」