タグ付けされた質問 「population」

母集団は、サンプルが抽出される単位のセット全体です。

1
母集団をどのようにサンプリングするかは重要ですか?
私は無数のビー玉を含むよく混ぜられたバットを持っています。そこビー玉の無限の量がバットであるが、彼らは唯一のいくつかの未知で来るが、有限数の品種: kは不明であり、i ≠ jの場合、v iタイプの大理石を描く方がv jタイプの大理石を描くよりも可能性が高いかもしれません。V= { v1、v2、v3、。。。、vk}V={v1,v2,v3,...,vk}\mathcal{V} = \{v_{1},v_{2},v_{3},...,v_{k}\} kkki≠ji≠ji\neq jviviv_ivjvjv_j 実験では、機械が未知の手順を使用してバットをサンプリングします。機械は、設定された報告記述Q ≤ k個のサンプルから大理石の品種: X ⊆ Vを、XXXq≤kq≤kq\leq kX⊆V;|X|=qX⊆V;|X|=q X \subseteq \mathcal{V}; \quad |X|=q この実験の試験が繰り返される(試験を横切って固定されている)、我々は、サブセットのシーケンスを取得Vを、(X 1、X 2、... )。qqqVV\mathcal{V}(X1,X2,…)(X1,X2,…)(X_1,X_2,\dots) 私たちが知っている他の唯一のものは: 試験は独立しており、同一です マシンは、そのサンプルで最も頻繁に発生する品種の上位報告しますqqq qqqqqq (X1,X2,…)(X1,X2,…)(X_1,X_2,\dots)

2
混合モデルのパラメトリック、セミパラメトリック、ノンパラメトリックブートストラップ
以下の移植片は、この記事から引用したものです。私はブートストラップの初心者であり、R bootパッケージを使用した線形混合モデルのパラメトリック、セミパラメトリック、ノンパラメトリックのブートストラップブートストラップを実装しようとしています。 Rコード これが私のRコードです: library(SASmixed) library(lme4) library(boot) fm1Cult <- lmer(drywt ~ Inoc + Cult + (1|Block) + (1|Cult), data=Cultivation) fixef(fm1Cult) boot.fn <- function(data, indices){ data <- data[indices, ] mod <- lmer(drywt ~ Inoc + Cult + (1|Block) + (1|Cult), data=data) fixef(mod) } set.seed(12345) Out <- boot(data=Cultivation, statistic=boot.fn, R=99) Out ご質問 …
9 r  mixed-model  bootstrap  central-limit-theorem  stable-distribution  time-series  hypothesis-testing  markov-process  r  correlation  categorical-data  association-measure  meta-analysis  r  anova  confidence-interval  lm  r  bayesian  multilevel-analysis  logit  regression  logistic  least-squares  eda  regression  notation  distributions  random-variable  expected-value  distributions  markov-process  hidden-markov-model  r  variance  group-differences  microarray  r  descriptive-statistics  machine-learning  references  r  regression  r  categorical-data  random-forest  data-transformation  data-visualization  interactive-visualization  binomial  beta-distribution  time-series  forecasting  logistic  arima  beta-regression  r  time-series  seasonality  large-data  unevenly-spaced-time-series  correlation  statistical-significance  normalization  population  group-differences  demography 

1
t分布に従って正確に何が分布されますか?
t分布の背後にある考え方を理解しようとします。これまでに理解した手順は次のとおりです。 N要素のサンプルを使用して、母平均を推定します。詳細には、母平均の推定値としてサンプル平均を使用します。 見積もりが実際の値にどれだけ近いかを知りたいのです。または、より具体的には、母平均が特定の確率でこの間隔内にあると言えるように、サンプル平均の周囲の間隔をどのくらい大きくする必要があるかを知りたいです。 この質問に答えるために、母集団の値は、既知の平均と標準偏差をもつ正規分布に従って分布していると仮定します。 母集団内の値の分布のパラメータがあれば、母集団の分布と標本のサイズの関数として、標本平均の分布を計算できます。 標本平均の分布も、次の数式で与えられる母集団分布と標準偏差と同じ平均の正規分布であることを示すことができます。ここで、は標本のサイズです。 Ns = σ/ N−−√s=σ/Ns = \sigma/\sqrt{N}NNN サンプル平均の分布があれば、サンプル平均が実際の平均からXだけ離れている確率を簡単に計算できます。つまり、母平均がサンプル平均の周りの特定の間隔内にある確率を計算できます。 。 ほぼ必要なものです。唯一の問題は、実際の設定では、母集団の分布の標準偏差がわからないことが多いことです(これは、母集団の平均値の周囲に標本平均がどのように分布するかを決定するパラメーターです)。 私たちにできることは、母集団標準偏差を標本標準偏差で置き換えることです。言い換えると、正確な未知のパラメータを、その概算で置き換えます。 だから、これが今のところです。母集団STDを標本STDで置き換えることにより、標本平均の分布の推定をさらに悪くします。そして、分布のパラメーターのこの「誤った」値を「補正」するために、分布の形状を変更します(これは正規分布ではなくなったと言います。これはt分布です)。しかし、t分布に従って正確に何が分布されるのでしょうか。母集団STDがわかっている場合、標本平均が母集団平均の周囲にどのように分布しているかがわかります。これで、母集団のSTDはわかりませんが、母集団の平均値の周りの標本平均の分布は変わりません。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.