タグ付けされた質問 「point-estimation」


2
パラメータ推定のために二項分布の尤度関数を導出する方法は?
Miller and Freund's Probability and Statistics for Engineers、8ed(pp.217-218)によれば、二項分布(ベルヌーイ試行)で最大化される尤度関数は次のように与えられます。 L (p )= ∏ni = 1pバツ私(1 − p )1 - x私L(p)=∏私=1npバツ私(1−p)1−バツ私L(p) = \prod_{i=1}^np^{x_i}(1-p)^{1-x_i} この方程式に到達する方法は?他の分布であるポアソンとガウス分布に関しては、私にはかなり明らかなようです。 L (θ )= ∏ni = 1distのPDFまたはPMF。L(θ)=∏私=1ndistのPDFまたはPMF。L(\theta) = \prod_{i=1}^n \text{PDF or PMF of dist.} しかし、二項式のものは少し異なります。率直に言うと、どのように n Cバツ pバツ(1 − p )n − xnCバツ pバツ(1−p)n−バツnC_x~p^x(1-p)^{n-x} なる pバツ私(1 − p )1 …

2
縮退
ピアソン相関係数の人口値の2種類の推定量について、私の頭の中にいくつかの混乱がありました。 A. フィッシャー(1915)二変量正規母集団実証するためにあることを示したである負にバイアスの推定量ρバイアスだけ小さいサンプルサイズ(のために実際にかなりの量であることができるが、N &lt; 30)。サンプルrは、ρよりも0に近いという意味でρを過小評価しています。(後者が0または± 1の場合を除き、rは不偏です。)ρのほぼ不偏の推定量がいくつか提案されています。rrrρρ\rhon&lt;30n&lt;30n<30rrrρρ\rho000ρρ\rho000±1±1\pm 1rrrρρ\rhoオルキンとプラット(1958)は修正しました。rrr runbiased=r[1+1−r22(n−3)]runbiased=r[1+1−r22(n−3)]r_\text{unbiased} = r \left [1+\frac{1-r^2}{2(n-3)} \right ] B.回帰では、は対応する母集団のR平方を過大評価していると言われています。または、単回帰で、それはつまり、R 2つの過大評価はρ 2。事実に基づいて、私はそれを言って、多くのテキストを見てきましたrがされ積極相対バイアスにρを絶対値を意味する、:rは遠くからである0よりρ(?その文が真です)。テキストは、サンプル値による標準偏差パラメーターの過大評価と同じ問題であると述べています。観測されたR 2を「調整」するための多くの式が存在しますR2R2R^2r2r2r^2ρ2ρ2\rho^2rrrρρ\rhorrr000ρρ\rhoR2R2R^2人口パラメータに近いWherryの(1931) は最もよく知られています(ただし、最良ではありません)。そのような調整されたr 2 adjのルートはshrunken rと呼ばれます:R2adjRadj2R_\text{adj}^2r2adjradj2r_\text{adj}^2 rrr rshrunk=±1−(1−r2)n−1n−2−−−−−−−−−−−−−−√rshrunk=±1−(1−r2)n−1n−2r_\text{shrunk} = \pm\sqrt{1-(1-r^2)\frac{n-1}{n-2}} 2つの異なる推定量が存在します。非常に異なる:最初のものはrを膨張させ、2番目はrを収縮させます。それらを調整する方法は?1つをどこで使用/報告し、もう1つを報告しますか?ρρ\rhorrrrrr 特に、「縮められた」推定量も(ほぼ)偏りのない「偏りのない」推定値であるが、異なるコンテキストでのみ-回帰の非対称コンテキストであるというのは事実でしょうか。というのは、OLS回帰では、片側(予測子)の値を固定値と見なし、サンプルからサンプルへのランダムエラーなしで対応するためですか?(そして、ここに追加するために、回帰は二変量正規性を必要としません。)

2
最小分散の不偏推定の理論は大学院で強調されていますか?
最近、完全に間違った均一分布のパラメーターの最小分散不偏推定値について、カフスの答えを出したとき、私は非常に恥ずかしかったです。幸いなことに、私はヘンリー枢機andとヘンリーによって直され、ヘンリーはOPに正しい答えを提供しました。 これは私に考えさせられました。およそ37年前にスタンフォード大学の大学院数学統計クラスで、最も公平な推定量の理論を学びました。ラオ・ブラックウェルの定理、クラマー-ラオの下限、レーマン・シェッフェの定理を思い出します。しかし、応用統計学者として、私は日々の生活の中でUMVUEについてあまり考えませんが、最尤推定は多く出てきます。 何故ですか?大学院ではUMVUE理論を強調しすぎていますか?私はそう思う。まず第一に、公平性は重要な財産ではありません。多くの完全に良いMLEには偏りがあります。スタイン収縮推定量は偏っていますが、平均二乗誤差損失の観点から不偏MLEを支配しています。これは非常に美しい理論(UMVUE推定)ですが、非常に不完全であり、あまり有用ではないと思います。他の人はどう思いますか?


4
懐疑的な(数学を嫌う)読者のための推論
統計情報のオンラインコースのイントロの一部である、統計的推論(「比率と平均の比較」)に関する講義を見ました。この素材は、いつものように私にはほとんど意味がありませんでした(今までに、このようなものを何十回も見たに違いありません。過去30年間に広がっていました)。 私は懐疑的な読者を納得させるという問題を真剣に受けとめる「基本的な統計-101」(ポイント推定、推定評価、統計的推論、仮説検定、研究デザイン)に関する本を探しています... 以下に、私が探している著者が真剣に受け止め、説得力を持って対処する方法を知っているタイプの質問の例をいくつか示します。 しかし、最初に、この投稿ではこれらの質問をしているわけではない ことを強調します。答えないでください! 私はそれらを単なる例として、「リトマス試験」(検索する著者のタイプ)として提供します。 「割合」がブール変数(つまり、値0と1のみをとる変数)の単純な平均である場合、「割合」と「手段」で統計的推論を行うための異なる手順が教えられるのはなぜですか。 正規分布が非常に堅牢で、そのデータが完全に正規分布していない場合でも正規性を仮定すると良い結果が得られる場合、およびt分布が非常に正規に見える場合、なぜt分布の代わりに正常? 「自由度」とは正確に何であり、なぜそれらを心配するのですか? データに似ているように見える分布を使用していることを考慮して、パラメーターの「真の」値とはどういう意味ですか? どうして「探索的データ分析」は良いことなのに、「データスヌーピング」は悪いことなのでしょうか? 私が言ったように、私はそのような質問の怠慢によって暗示されている態度に先送りされています。私に何かを教えている人に見たいのは「認識論的スタンス」ではありません。私は、読者の懐疑論と合理性を尊重し、それらに対処する方法を知っている(必ずしもページと形式主義と技術のページに行くことなく)著者を探しています。 これは非常に難しいことであり、統計に関しては特にそうだと思います。したがって、多くの著者がそれに成功するとは思わない。しかし、現時点では、1つだけを見つけることに満足しています。 私が数学嫌いではないことを付け加えましょう。それどころか、数学が大好きです。(私は分析[別名「高度な計算」)、線形代数、確率理論、さらには基本測度理論に満足しています。) とはいえ、現時点での私の関心は、「応用」、「実用的」、「毎日」、「現実世界」の統計(理論的な微妙さとは対照的)にあります。(しかし、私も料理本は必要ありません!) FWIW、私は回帰とゲルマンとヒルによるマルチレベル/階層モデルを使用したデータ分析の最初のいくつかの章を読みました、そして、著者の口調が好きです。彼らの焦点は実用的ですが、必要に応じて理論に入ります。彼らはまた、しばしば後退し、標準的な実践を批判的に評価し、懐疑的な読者の常識に訴える率直な意見を提供します。残念ながら、これらの著者は、この投稿で私が質問している主題(上記の「Stats 101」など)に専念した本を書いていません。また、これらの著者の1人(Gelman)が非常に尊敬されているベイジアンデータ分析を共著していることも知っていますが、これも現時点で私が探しているものではありません。 編集: Dikran Marsupialは次の異議を提起します。 質問を無視することには必ずしも悪いことはないと思います。すべての質問に対処することは、多くの場合より重要な基本概念の説明を損なう点になります(特に統計101の本で!)。 私はそれに同意します。「基本的な統計の再確認」を探していると言った方が正確です。実際、これを私のモチベーションとして、推論に関する大学院課程で使用されている教科書(例)を見て、リストしたような質問を無視しすぎていることがわかりました。どちらかといえば、彼らはそのような質問を掘り下げる傾向がさらに少ないように見えました(したがって、彼らはいくつかの収束、またはこれ、またはその他の条件のような問題に集中することができます...)。 問題は、より高度な本が根本的に異なる読者集団に向けられていることであり、その読者は「部外者の懐疑論」が劇的に枯渇している。IOW、大学院レベルの統計を取っている人は、私を悩ませる質問に悩まされるポイントを過ぎています。彼らはもはやこのようなものについて懐疑的ではありません。(彼らはどのように懐疑的なこぶを乗り越えたのでしょうか?おそらく彼らがかなり早い段階で統計を学んだ場合は、そもそもそれほど批判的ではなかったのかもしれません。教科書が足りないところを埋めてくれる教師がいた人もいれば、そうした質問に対する答えを自分で理解できるほど賢い人もいたかもしれません。

2
MLEの不変のプロパティ:のMLEが何であるかを
MLEの不変性:場合のMLEである任意の機能のために、次に、のMLEある。 θ^θ^\hat{\theta}θθ\thetaf(θ )f(θ)f(\theta)f(θ )f(θ)f(\theta)f(θ^)f(θ^)f(\hat{\theta}) また、は1対1の関数でなければなりません。fff この本は、「たとえば、通常の平均の二乗であるを推定するために、マッピングは1対1ではありません」と述べています。したがって、不変性プロパティは使用できません。θ2θ2{\theta}^2 しかし、その後、それはその性質を証明し、「 MLEであり、正規平均の乗はことがわかりました」と述べています。θ2θ2\theta^2バツ¯2バツ¯2\bar{x}^2 これは自己矛盾しているようです。 2乗していが、何かの2乗は1対1ではありません。ここで何が間違っていますか?ありがとう!バツ¯バツ¯\bar{x} ソース:カゼッラ&バーガー「統計的推論」

3
ベイズ推定器は、真のパラメーターが前のものの可能な変量であることを要求しますか?
これは哲学的な質問のビットかもしれませんが、ここで私達は行く:決定理論では、リスクのベイズ推定量θ(X )のためのθ ∈ Θ事前分布に関して定義されたπのΘ。θ^(x)θ^(x)\hat\theta(x)θ∈Θθ∈Θ\theta\in\Thetaππ\piΘΘ\Theta ここで、一方で、真のがデータを生成した(つまり、「存在する」)には、θはπの下で可能な変数である必要があります。一方、θは既知ではないため、事前分布が選択されているため、真のθが、選択したπの下で可能な変量であるという保証はありません。θθ\thetaθθ\thetaππ\piθθ\thetaθθ\thetaππ\pi さて、どうやらθが変量になるようにを選択する必要があるようです。そうでなければ、特定の定理が成り立たなくなります。たとえば、ミニマックス推定値は、最も好ましい事前分布のベイズ推定値にはなりません。なぜなら、その領域からθを含む大きな領域を除外し、その領域からθを含めることで、事前分布を任意に悪くすることができるからです。ただし、θが実際に領域内にあることを保証することは困難です。ππ\piθθ\thetaθθ\thetaθθ\theta だから私の質問は: 一般的に、実際のはπの可能な変量であると想定されていますか?θθ\thetaππ\pi これは保証されますか? これに違反するケースは少なくとも何らかの方法で検出できるので、条件が満たされない場合、ミニマックスなどの定理に依存しませんか? それが必要でない場合、なぜ決定理論の標準結果が保持されるのですか?

1
十分性または不十分性
ランダムサンプル検討Xはiは IIDである BのEのRがN 、O 、U 、L L I (P )の確率変数P ∈ (0 、1 )。T (X )= X 1 + 2 X 2 + X 3がpの十分な統計であるかどうかを確認し ます。{ X1、X2、X3}{X1,X2,X3}\{X_1,X_2,X_3\}バツ私XiX_iB Eのr個のN 、O 、U 、L L I (P )Bernoulli(p)Bernoulli(p)P ∈ (0 、1 )p∈(0,1)p\in(0,1)T(X)= X1+ 2 X2+ X3T(X)=X1+2X2+X3T(X)=X_1+2X_2+X_3ppp まず、の分布をどのように見つけることができますか?または、それをX 1 + X 2 + X …

1
GPSベースのレポートから未知の数の実世界の場所を特定する
いくつかのGPSベースのレポートから実際の位置(feスピードカム)を特定するソフトウェアの開発に取り組んでいます。場所を報告するとき、ユーザーは運転しているので、報告は非常に不正確です。その問題を解決するには、同じ場所に関するレポートをクラスター化し、平均を計算する必要があります。 私の質問は、これらのレポートをクラスター化する方法についてです。期待値最大化アルゴリズムとk平均クラスタリングについて読みましたが、理解したとおり、実際の位置の数を事前に決定する必要があります。 実際の場所の正確な数を必要とせず、代わりにいくつかのエッジ条件を使用する他のアルゴリズムはありますか? レポートには、経度、緯度、および精度(メートル単位)が含まれています。重複を識別するために使用できる名前などはありません。 別の障害は、それが一般的であり、実際の場所のレポートが1つしかないことです。そのため、外れ値と適切なデータを区別するのが難しくなっています。

2
Gibbs SamplerのRao-Blackwellization
私は現在、マルコフ連鎖モンテカルロ法で確率ボラティリティモデルを推定しています。これにより、ギブスとメトロポリスのサンプリング方法を実装しています。ランダムなサンプルではなく、事後分布の平均を取ると仮定すると、これは一般にRao-Blackwellizationと呼ばれるものですか? 全体として、これは事後分布の平均に対する平均をパラメーター推定値として取得することになります。
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.