タグ付けされた質問 「confidence-interval」

信頼区間は、信頼度で未知のパラメーターをカバーする区間です。信頼区間は、頻度主義の概念です。それらは、ベイジアンアナログである信頼できる間隔と混同されることがよくあります。 (1α)%

2
ログ変換後の標準エラーの計算
正規分布している数のランダムなセットを考えます: x <- rnorm(n=1000, mean=10) 平均と平均の標準誤差を知りたいので、次のことを行います。 se <- function(x) { sd(x)/sqrt(length(x)) } mean(x) # something near 10.0 units se(x) # something near 0.03 units すばらしいです! ただし、元の分布が正規分布に従うことを必ずしも知らないと仮定します。データをログ変換し、同じ標準誤差計算を実行します。 z <- log(x, base=10) mean(z) # something near 1 log units se(z) # something near 0.001 log units クールですが、ログ単位ではなく単位で答えを得るために逆変換する必要があります。 10^mean(z) # something near 10.0 …

3
対数正規データセットの平均の信頼区間を計算するにはどうすればよいですか?
いくつかの場所で、各サンプルの対数を取り、変換されたデータの信頼区間を計算し、逆演算を使用して信頼区間を元に戻すことにより、データセットを正規分布のものに変換できることを聞きました(たとえば、場合は、それぞれ下限と上限の10の累乗になり)。ログ10ログ10\log_{10} ただし、単に平均自体に対して機能しないという理由だけで、このメソッドには少し疑いがあります10平均(ログ10(X))≠ 平均(X)10平均⁡(ログ10⁡(バツ))≠平均⁡(バツ)10^{\operatorname{mean}(\log_{10}(X))} \ne \operatorname{mean}(X) これを行う正しい方法は何ですか?平均自体で機能しない場合、平均の信頼区間でどのように機能しますか?

3
非正規分布サンプルの平均の信頼区間を計算するにはどうすればよいですか?
非正規分布サンプルの平均の信頼区間を計算するにはどうすればよいですか? ここではブートストラップ方式が一般的に使用されていることを理解していますが、他のオプションも受け入れています。ノンパラメトリックオプションを探していますが、パラメトリックソリューションが有効であることを誰かが私に納得させることができれば、それは問題ありません。サンプルサイズは400を超えています。 誰かがRでサンプルを提供できれば、とてもありがたいです。

4
平均の信頼区間を計算する方法は?
実験を3回繰り返すと想像してください。各実験では、3つの測定値を収集します。3つの実験的手段の違いと比較して、3つはかなり近い傾向があります。総平均の計算は非常に簡単です。しかし、どうすれば大平均の信頼区間を計算できますか? サンプルデータ: 実験1:34、41、39 実験2:45、51、52 実験3:29、31、35 各実験の平均値がそうであるように、実験内の複製値はガウス分布に従うと仮定します。実験内の変動のSDは、実験的手段間のSDよりも小さくなっています。また、各実験で3つの値の順序付けがないと仮定します。各行の3つの値の左から右への順序は完全に任意です。 簡単なアプローチは、最初に各実験の平均を計算することです:38.0、49.3、および31.7、次にこれらの3つの値の平均とその95%信頼区間を計算します。この方法を使用すると、総平均は39.7で、95%の信頼区間は17.4から61.9の範囲です。 このアプローチの問題は、3つの複製の間の変動を完全に無視することです。そのバリエーションを説明する良い方法がないのだろうか。

3
プロファイル尤度と信頼区間の関係は何ですか?
このチャートを作成するために、mean = 0およびsd = 1の正規分布から異なるサイズのランダムサンプルを生成しました。その後、t.test()関数を使用して.001から.999(赤い線)の範囲のアルファカットオフを使用して信頼区間を計算し、以下のコードを使用してプロファイル尤度を計算しました。現時点でリンクを見つける編集:見つかった)、これは青い線で示されています。緑の線は、R density()関数を使用して正規化された密度を示し、データは各チャートの下部にある箱ひげ図で示されます。右側には、95%の信頼区間(赤)と最大尤度区間の1/20(青)のキャタピラープロットがあります。 プロファイル尤度に使用されるRコード: #mn=mean(dat) muVals <- seq(low,high, length = 1000) likVals <- sapply(muVals, function(mu){ (sum((dat - mu)^2) / sum((dat - mn)^2)) ^ (-n/2) } ) 私の特定の質問は、これらの2種類の間隔の間に既知の関係があるかどうか、およびn = 3の場合を除いてすべてのケースで信頼区間がより保守的に見える理由です。計算が有効かどうか(およびこれを行うためのより良い方法)およびこれら2つのタイプの間隔の一般的な関係についてのコメント/回答も必要です。 Rコード: samp.size=c(3,4,5,10,20,1000) cnt2<-1 ints=matrix(nrow=length(samp.size),ncol=4) layout(matrix(c(1,2,7,3,4,7,5,6,7),nrow=3,ncol=3, byrow=T)) par(mar=c(5.1,4.1,4.1,4.1)) for(j in samp.size){ #set.seed(200) dat<-rnorm(j,0,1) vals<-seq(.001,.999, by=.001) cis<-matrix(nrow=length(vals),ncol=3) cnt<-1 for(ci in …

5
なぜ比率の信頼区間を構築するためにt分布を利用しないのですか?
未知の母標準偏差(sd)を持つ平均の信頼区間(CI)を計算するには、t分布を使用して母標準偏差を推定します。なお、ここで。ただし、母集団の標準偏差のポイント推定値がないため、近似を使用して推定しここでCI=X¯±Z95%σX¯CI=X¯±Z95%σX¯CI=\bar{X} \pm Z_{95\% }\sigma_{\bar X}σX¯=σn√σX¯=σn\sigma_{\bar X} = \frac{\sigma}{\sqrt n}CI=X¯±t95%(se)CI=X¯±t95%(se)CI=\bar{X} \pm t_{95\% }(se)se=sn√se=snse = \frac{s}{\sqrt n} 対照的に、人口の割合については、CIを計算するために、として近似します。ここではおよびCI=p^±Z95%(se)CI=p^±Z95%(se)CI = \hat{p} \pm Z_{95\% }(se)se=p^(1−p^)n−−−−−√se=p^(1−p^)nse = \sqrt\frac{\hat{p}(1-\hat{p})}{n}np^≥15np^≥15n \hat{p} \ge 15n(1−p^)≥15n(1−p^)≥15n(1-\hat{p}) \ge 15 私の質問は、なぜ人口比率の標準分布に満足しているのですか?

1
線形回帰係数の信頼区間は、正規分布または
単純なANOVAなどの線形モデルを作成してみましょう。 # data generation set.seed(1.234) Ng <- c(41, 37, 42) data <- rnorm(sum(Ng), mean = rep(c(-1, 0, 1), Ng), sd = 1) fact <- as.factor(rep(LETTERS[1:3], Ng)) m1 = lm(data ~ 0 + fact) summary(m1) 結果は次のとおりです。 Call: lm(formula = data ~ 0 + fact) Residuals: Min 1Q Median 3Q Max -2.30047 …

3
サンプルが大きい場合にT分布を使用して平均を推定してみませんか?
基本統計コースでは、標本サイズnが大きい(通常は30または50を超える)場合に、正規分布を使用して母集団パラメーターの平均を推定することをお勧めします。スチューデントのT分布は、サンプルの標準偏差の不確実性を考慮して、より小さいサンプルサイズに使用されます。サンプルサイズが大きい場合、サンプルの標準偏差は母標準偏差に関する適切な情報を提供し、正規分布の推定を可能にします。わかった。 しかし、信頼区間を正確に取得できるのに、なぜ推定値を使用するのでしょうか?サンプルサイズに関係なく、T分布で正確に得られるものの単なる推定値である場合、正規分布を使用するポイントは何ですか?

1
ブートストラップベースの信頼区間
ブートストラップベースの信頼区間を勉強しているときに、私はかつて次の声明を読みました。 ブートストラップ分布が右に歪んでいる場合、ブートストラップベースの信頼区間には、エンドポイントをさらに右に移動する補正が組み込まれています。これは直観に反するように思えるかもしれませんが、正しいアクションです。 上記の声明の根底にあるロジックを理解しようとしています。

4
狭い信頼区間—より高い精度?
信頼区間について2つの質問があります。 明らかに、信頼区間が狭いということは、その区間内で観測値を取得する可能性が低いことを意味するため、精度が高くなります。 また、95%信頼区間は、99%信頼区間よりも狭くなっています。 99%の信頼区間は、95%よりも正確です。 精度と狭さのこの違いを理解するのに役立つ簡単な説明を誰かがくれますか?

4
2つの信頼区間/ポイント推定値の組み合わせ
同じ母集団からの2つの独立したサンプルがあり、2つのサンプルで異なる方法を使用して、ポイント推定と信頼区間を導出するとします。些細なケースでは、賢明な人は2つのサンプルをプールし、1つのメソッドを使用して分析を行いますが、現時点では、欠損データなどのサンプルの1つの制限のために別のメソッドを使用する必要があるとします。これらの2つの別々の分析は、関心のある母集団属性の独立した等しく有効な推定値を生成します。直観的には、これらの2つの推定値を、ポイント推定値と信頼区間の両方の観点から適切に組み合わせて、推定手順を改善する方法があるはずだと思います。私の質問は、それを行う最善の方法は何ですか?各サンプルの情報/サンプルサイズに応じて、ある種の加重平均を想像できますが、信頼区間はどうですか?

2
「ランダムな」信頼性または信頼できる間隔を使用するのはなぜですか?
私は最近、自信と信頼できる間隔にランダム性を組み込んだ論文を読んでいたのですが、これが標準かどうか(そしてそうであれば、なぜそれが妥当なことなのか)疑問に思いました。表記法を設定するには、データがあり、パラメーター区間を作成することに関心があると仮定します。私は、関数を構築することによって構築される信頼/信頼区間に慣れています:θ ∈ ΘX ∈ Xバツ∈バツx \in Xθ ∈ Θθ∈Θ\theta \in \Theta fバツ:Θ → { 0 、1 }fバツ:Θ→{0、1}f_{x} : \Theta \rightarrow \{0,1\} 間隔をます。私= { θ ∈ Θ:fバツ(θ)= 1 }私={θ∈Θ:fバツ(θ)=1}I = \{ \theta \in \Theta \, : \, f_{x}(\theta) = 1\} これは、データに依存するという意味でランダムですが、データに条件があるのは単なる間隔です。このペーパーでは、代わりに gバツ:Θ → [ 0 、1 ]gバツ:Θ→[0、1]g_{x} : \Theta \rightarrow [0,1] …

5
平均の信頼区間の近似誤差
ましょう{Xi}ni=1{Xi}i=1n\{X_i\}_{i=1}^nの値を取る確率変数IIDのファミリーである[0,1][0,1][0,1]平均を有する、μμ\mu及び分散σ2σ2\sigma^2。平均、使用するためのシンプルな信頼区間σσ\sigmaそれが知られるたびに、によって与えられ、 P(|X¯−μ|>ε)≤σ2nε2≤1nε2(1).P(|X¯−μ|>ε)≤σ2nε2≤1nε2(1). P( | \bar X - \mu| > \varepsilon) \le \frac{\sigma^2}{n\varepsilon^2} \le\frac{1}{n \varepsilon^2} \qquad (1). また、理由X¯−μσ/n√X¯−μσ/n\frac{\bar X- \mu}{\sigma/\sqrt{n}}は、標準正規確率変数として漸近的に分布します。正規分布は、近似信頼区間を「構築」するために使用される場合があります。 複数の選択肢の回答の統計試験では、私はこの近似を使用する代わりにしなければならなかった(1)(1)(1)いつでもn≥30n≥30n \geq 30。近似誤差が定量化されていないため、私は常にこれを非常に不快に思っています(想像以上です)。 なぜではなく、正規近似を使用(1)(1)(1)? 私は盲目的にルール適用するには、二度と、したくないn≥30n≥30n \geq 30。そうすることを拒否し、適切な代替手段を提供するのに役立つ良い参考文献はありますか?((1)(1)(1)は、私が適切な代替案と考えるものの例です。) ここで、σσ\sigmaとE[|X|3]E[|X|3]E[ |X|^3]は不明であり、簡単に制限されます。 私の質問は特に信頼区間に関する参照要求であるので、こことここで部分的な複製として提案された質問とは異なることに注意してください。そこでは答えられません。

2
「標準誤差」と「信頼区間」が測定の精度を測定する場合、精度の測定は何ですか?
40ページの「ダミーの生物統計」の本で私は読んだ: 標準誤差(SEと略記)は、推定値または測定値の精度を示す1つの方法です。 そして 信頼区間は、何かの推定または測定の精度を示す別の方法を提供します。 しかし、測定の正確さを示す方法は何も書かれていません。 質問:何かの測定がどれほど正確であるかを示す方法は?そのためにどの方法が使用されますか? テストの精度と精度と混同しないでください:https : //en.wikipedia.org/wiki/Accuracy_and_precision#In_binary_classification

1
ggplotは回帰の信頼区間をどのように計算しますか?
Rプロットパッケージggplot2には、関連する信頼帯を使用して回帰直線(または曲線)をプロットするためのstat_smoothという素晴らしい関数があります。 ただし、回帰線(または「メソッド」)のたびに、この信頼帯がどのように生成されるかを正確に把握するのは困難です。どうすればこの情報を見つけることができますか?

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.