タグ付けされた質問 「bias」

パラメータ推定器の期待値とパラメータの真の値の差。このタグを使用して[bias-term] / [bias-node](つまり[intercept])を参照しないでください。

1
線形回帰における変数バイアスの省略
変数バイアスの省略について、哲学的な質問があります。 我々は、一般的な回帰モデル(母集団モデル)は サンプルが由来である(Y 、X 1、。。。、X N)、次いで、及びOLS推定値は非常にうまく挙動する条件の束。Y=β0+β1X1+...+βnXn+υ,Y=β0+β1X1+...+βnXn+υ, Y= \beta_0 + \beta_1X_1 + ... + \beta_nX_n + \upsilon, (Y,X1,...,Xn)(Y,X1,...,Xn)(Y,X_1,...,X_n) 私たちは主な変数の1を省略した場合、我々は、それを知って、、このかもしれないバイアスの推定値β 0、β 1、。。。、β K - 1、β 、K + 1、。。。、β nは。これは、少なくとも、推定上の変数の残りの効果影響を与えるY、そしてまたについて仮説検定β 1、β 2、。。。、予測値は信頼できないため。XkXkX_kβ0,β1,...,βk−1,βk+1,...,βnβ0,β1,...,βk−1,βk+1,...,βn\beta_0, \beta_1, ..., \beta_{k-1}, \beta_{k+1}, ..., \beta_nYYYβ1,β2,...β1,β2,...\beta_1, \beta_2, ... 実は、どの変数が真の母集団モデルにあるのかわかりません。代わりに、候補者が多数あり、そこから分析して最も適切なサブセットを見つける必要があります。この変数選択のプロセスでは、OLS推定と仮説検定を再度使用します。これに基づいて、さまざまな変数を拒否または含めます。しかし、各候補モデルは関連する変数を省略しているため(真のモデルを見つけることはできません)、これらの決定は偏った結果に基づいているのではないでしょうか。では、なぜ彼らを信頼すべきなのでしょうか。 (たとえば、1つの変数を選択してから残りを追加するフォワードステップワイズ法を考えています。推論を行うモデルを比較し、省略された変数がすべてを妨害している可能性があると考えています。) 私はそれを考え始めるまでこのトピックについて心配しすぎたことは一度もありませんでしたし、どこか間違っていると確信しています。

3
バイアスされたサンプリングによる指数分布のパラメーター推定
偏った条件下でこの分布から抽出されたサンプル母集団から、指数分布のパラメーターを計算したいと思います。私の知る限り、n個の値のサンプルの場合、通常の推定量はです。しかし、私のサンプルは次のように偏っています:E - λ X λ = Nλλ\lambdae−λxe−λxe^{-\lambda x}λ^=n∑xiλ^=n∑xi\hat{\lambda} = \frac{n}{\sum x_i} 指数分布からiidで描かれたm個の要素の完全な母集団から、n個の最小の要素だけが知られています。このシナリオでパラメータをどのように推定できますか?λλ\lambda もう少し厳密に言うと、がから抽出されたiidサンプルである場合、すべてのに対してあり、私は推定することができる方法をセットから。E - λ X I &lt; J X I ≤ X jの λ { X 1、X 2、X 3、。。。、x n } n &lt; m{x1,x2,x3,...,xm}{x1,x2,x3,...,xm}\{x_1,x_2,x_3,...,x_m \}e−λxe−λxe^{-\lambda x}i&lt;ji&lt;ji < jxi≤xjxi≤xjx_i \leq x_jλλ\lambda{x1,x2,x3,...,xn}{x1,x2,x3,...,xn}\{x_1,x_2,x_3,...,x_n\}n&lt;mn&lt;mn < m どうもありがとう! マイケル

3
SPSSを使用した2x3混合設計ANOVAの事後テスト?
実験中に3回評価された10人の参加者の2つのグループがあります。グループ間および3つの評価全体の違いをテストするために、group(コントロール、実験)、time(最初、2、3)、およびを使用して2x3混合設計ANOVAを実行しましたgroup x time。両方timeとgroup有意な相互作用があったほか、重大な結果group x time。 グループメンバーシップに関しても、3回の評価の違いをさらにチェックする方法をよく知りません。実際、最初は、ANOVAのオプションで、ボンフェローニの補正を使用してすべての主要な効果を比較することだけを指定しました。しかし、この方法で、グループを区別せずに、サンプル全体の時間の違いをこのように比較したことに気付きましたね。 したがって、可能な解決策を見つけるためにインターネットでたくさん検索しましたが、結果はほとんどありませんでした。私と同じようなケースは2つしか見つかりませんでしたが、解決策は逆です! 記事では、混合設計の後、著者らは被験者ごとに1つずつ、2回の反復測定ANOVAを事後的に実行しました。このようにして、2つのグループは修正なしで個別に分析されます。 インターネットのガイドでは、混合ANOVAの実行中に、SPSS構文のCOMPARE(time) ADJ(BONFERRONI)直後にを手動で追加すると述べています/EMMEANS=TABLES(newgroup*time)。このように、3つの時間はグループごとに個別に比較されます。ボンフェローニ補正を使用すると、私は正しいのでしょうか。 どう思いますか?どちらが正しい方法でしょうか?
8 anova  mixed-model  spss  post-hoc  bonferroni  time-series  unevenly-spaced-time-series  classification  normal-distribution  discriminant-analysis  probability  normal-distribution  estimation  sampling  classification  svm  terminology  pivot-table  random-generation  self-study  estimation  sampling  estimation  categorical-data  maximum-likelihood  excel  least-squares  instrumental-variables  2sls  total-least-squares  correlation  self-study  variance  unbiased-estimator  bayesian  mixed-model  ancova  statistical-significance  references  p-value  fishers-exact  probability  monte-carlo  particle-filter  logistic  predictive-models  modeling  interaction  survey  hypothesis-testing  multiple-regression  regression  variance  data-transformation  residuals  minitab  r  time-series  forecasting  arima  garch  correlation  estimation  least-squares  bias  pca  predictive-models  genetics  sem  partial-least-squares  nonparametric  ordinal-data  wilcoxon-mann-whitney  bonferroni  wilcoxon-signed-rank  traminer  regression  econometrics  standard-error  robust  misspecification  r  probability  logistic  generalized-linear-model  r-squared  effect-size  gee  ordered-logit  bayesian  classification  svm  kernel-trick  nonlinear  bayesian  pca  dimensionality-reduction  eigenvalues  probability  distributions  mathematical-statistics  estimation  nonparametric  kernel-smoothing  expected-value  filter  mse  time-series  correlation  data-visualization  clustering  estimation  predictive-models  recommender-system  sparse  hypothesis-testing  data-transformation  parametric  probability  summations  correlation  pearson-r  spearman-rho  bayesian  replicability  dimensionality-reduction  discriminant-analysis  outliers  weka 

3
OLS: 1番目の方程式のは2番目の方程式の標準誤差にバイアスをかけますか?
仮定との時系列である、(とは場合と似ていますが、ダミー= 1)の場合に変更されます。そして、。現実の世界では、これは社の定期的な株式市場のリターンになります(ただし、これは無視できます)。ダミーのがあり、これはでの単一性に等しく、それ以外の場合はゼロに等しくなります。OLS推定される時系列モデルは次のとおりです。Xit,YitXit,Yit{X_{it}},{Y_{it}}Xit∼N(0.1,1)Xit∼N(0.1,1)X_{it}\sim N(0.1,1)σ2(Yit)=1σ2(Yit)=1\sigma^2(Y_{it}) = 1mean(Yit)mean(Yit)mean(Y_{it})XitXitX_{it}t∈{1,2,...,200}t∈{1,2,...,200}t \in \{1,2,...,200\}i∈{1,2,...,N}i∈{1,2,...,N}i \in \{1,2,...,N\}NNNDtDtD_tt∈{150,151,...,200}t∈{150,151,...,200}t \in \{150,151,...,200\}∀i∀i\forall i (1)Yit=αi+βiXit+γiDt+ϵit(1)Yit=αi+βiXit+γiDt+ϵit(1) Y_{it} = \alpha_i + \beta_i X_{it} + \gamma_i D_{t} + \epsilon_{it} このモデルは通常、各ガウスマルコフ仮定に準拠しています。ただし、すべてのおよびに対してがあります。iiiE[ϵTitϵjt]≠0E[ϵitTϵjt]≠0E[\epsilon_{it}^T \epsilon_{jt}] \not= 0iiijjj 次のステップは、モデル推定値を使用してガンマのベクトルを作成することです。このベクトルを呼びます。次に、これを断面モデルで使用します。NNNγ(1)(1)(1)γ^γ^\bf{\hat{\gamma}} (2)γ^i=a+bZi+ui(2)γ^i=a+bZi+ui(2) \hat{\gamma}_i = a + b Z_i + u_i ここで、は、OLSの仮定に違反を引き起こさないいくつかの断面変数であり、説明に関連しています。γ IZiZiZ_iγ^iγ^i\hat{\gamma}_i 適用された計量経済学の文献に記載があることモデルにおけるにおけるOLS係数推定のための(i)は問題なしにリード、しかし、(ⅱ)に標準エラーにバイアス。E[ϵTitϵjt]≠0E[ϵitTϵjt]≠0E[\epsilon_{it}^T \epsilon_{jt}] \not= 0(1)(1)(1)(2)(2)(2)(2)(2)(2) これが事実である理由について誰かがアイデアを投稿してくれませんか? が式ものを理解できません。もちろん、はスカラーであり、スカラーを転置することはできません。これは、見ているHERE彼らはこの方法を適用する場合は、。ϵTitϵitT\epsilon_{it}^TE[ϵTitϵjt]≠0E[ϵitTϵjt]≠0E[\epsilon_{it}^T \epsilon_{jt}] \not= 0ϵitϵit\epsilon_{it}

2
バイアスと交絡変数のオーバーマッチング
私が理解しているように、マッチングは観察研究で因果関係を特定する1つの方法です。「類似」している観察を照合し、治療を受けたまたは受けなかった観察を比較することにより、これを一種の準実験と見なすことができます。 オーバーマッチングとは何ですか?それはどのようなバイアスをもたらしますか?私は主に経済学の観点からマッチングを見てきたが、最近、「オーバーマッチング」がバイアスにつながる可能性があることを示唆する疫学に関するいくつかの論文を見た。論文の用語を理解するのは難しいと思います。誰かが主要な概念のいくつかを説明してくれると助かります。以下はアイデアを参照する記事です: オーバーマッチングはバイアスを引き起こす可能性があります。BMJ。2002 8月10日。325(7359)

1
公平な推定者がいることはいつ重要ですか?
偏りのない見積もりよりも偏った見積もりを好む場合についていくつかの質問と回答がありますが、逆の質問には何も見つかりませんでした。 どのような状況で、公平な推定者のみを考慮することが重要ですか? 公平性の概念は入門的統計コースであることに多くの重点が置かれていますが、これについての説得力のある抗弁を読んだことはありません。通常、データを収集するのは1度だけなので、平均して正確であると便利な場合があります(心理的な快適さのほかに)。どのような状況で、平均的に正しい必要があるでしょうか? 私は哲学的な議論を受け入れますが、研究や業界の具体的な例を好むでしょう。

1
と正規化のバイアスと分散のプロパティ
線形回帰でから正規化に移行する場合、バイアスまたは分散の増加が予想されますか?バイアスはフィッティング不足の兆候であり、分散はフィッティング過剰の兆候であることに注意してください。定数λを想定します。L2L2L^2L1L1L^1 ここで大まかな目安を探しています。それがなく、答えが私が説明していない他のいくつかの要因に依存する場合は、説明してください。


2
バイアスという言葉には2つの定義がありますか?
統計学の文献ではバイアスという用語がよく使われていると聞いています。 例えば、 平均的な補完を使用することにより、推定にバイアスを加えています。 もう一つの例、 バイアス分散のトレードオフは、モデルを選択する際の重要な課題です。 これらは同じ「バイアス」ですか?

2
平均二乗バイアスの分解(統計学習の要素内)
The Statistics of Elements of Statistical Learningの 224ページの式7.14がどのようにして導き出されるのか理解できません。誰かがそれを理解するのを手伝ってくれる? Average squared bias=Average[model bias]2+Average[estimation bias]2Average squared bias=Average[model bias]2+Average[estimation bias]2\textrm{Average squared bias} = \textrm{Average}[\textrm{model bias}]^2 + \textrm{Average}[\textrm{estimation bias}]^2
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.