サンプルサイズ1から母集団について何と言うことができますか?


43

母集団の平均値について、もしあるとすれば何と言えるのか、1つの測定値y 1(サンプルサイズ1)だけでとき、μを疑問に思います。明らかに、より多くの測定値が必要ですが、それらを取得することはできません。μy1

これは、サンプルの平均のでように思わに自明等しいY 1、次いで、E [ ˉ Y ] = E [ Y 1 ] = μ。しかし、1のサンプルサイズで、サンプル分散が定義されていないため、使用中に私たちの自信ˉ Yの推定量としてμは、正しい、定義されていませんか?μの推定値を制限する方法はありますか?y¯y1E[y¯]=E[y1]=μy¯μμ


はい、信頼区間は特定の仮定の下で構築できます。誰も投稿していない場合、追跡します。μ
-soakley

5
同じ質問の別のバージョンについてはstats.stackexchange.com/questions/1807を参照してください(サンプルの平均は利用できますが、サンプルサイズではないため、事実上、平均は未知のサンプリング分布からの単一の観測です)およびstats.stackexchange関連する議論については、.com / questions / 20300
whuber

通常の場合のこれらの推定量の最適性を説明する最近の記事:tandfonline.com/doi/full/10.1080/00031305.2017.1360796
user795305

回答:


8

ポアソンのケースに関するこの質問に関する最新の記事は、素晴らしい教育的アプローチを取っています。

アンダーソン。PerGösta(2015)。1つの観測を使用したポアソン平均の近似信頼区間の構築への教室アプローチ アメリカの統計学者、69(3)、160-164、DOI:10.1080 / 00031305.2015.1056830


...残念ながらペイウォールの背後。
ティム

@ティム:そうです。繰り返しになりますが、ASAのメンバーシップはそれほど高くなく、非常にリーズナブルな価格でThe American StatisticianJASA、および他の多くのジャーナルにアクセスできます。ここでお金の価値があると本当に思う。もちろん、YMMV。
S. Kolassa -復活モニカ

4
+1ですが、分散が平均に等しくなければならないため、ポアソンの場合は通常の場合と根本的に異なります。ポアソンの結果は非常に簡単ですが、通常の場合の結果は直感に反し、神秘的です。x±9.68|x|
アメーバは、モニカーを復活させる

@amoeba:非常に正しいが、OPは配布に関する制限を指定しなかった。
S. Kolassa -復活モニカ

これは非常に短いため、コメントとして使用した方が良いでしょう。しかし、それは受け入れられた答えなので、おそらくコメントに変換したくないでしょう。それでは、記事の要点を要約していただけますか?
リチャードハーディ

42

母集団が正常であることがわかっている場合、単一の観測基づく95%信頼区間はx ± 9.68 | x |x

x±9.68|x|

これについては、Wall、Boen、およびTweedie、The American Statistician、2001年5月、Vol。の記事「サイズ1および2のサンプルによる平均の有効な信頼区間」で説明されています55、第2号。(pdf


5
私は愚かに聞こえるのは嫌いですが....確かにそうではありません。これは単位に依存し、適切に動作しません(適切にスカラー乗算を意味します。...)
アレックティール

8
@Alecプロシージャが測定単位に依存している(つまり不変ではない)からといって、それが自動的に無効になったり、不正になったりするわけではありません。これは有効です。記事を読んで数学を実行してください。しかし、多くの人は、それが少し不安になることを認めます。さらに驚くべきことに、基礎となる分布が正規であると仮定する必要さえありません:ユニモーダル分布でも同様の結果が保持されます(ただし、9.68を約19程度に増やす必要があります):これに対するコメントで提供したリンクを参照してください質問。
whuber

4
|μ|σ


3
95%σ|μ|>0μ=0100%0

28

μ


18
(+1)1つの観測は事前分布によって圧倒されるため、後方から取得するものは、事前分布よりも多くはないように見えます。
whuber

x±9.68|x|

x±9.68|x|x

@StephanKolassaいいえ、この間隔(および関連する分布)は尤度を形成します。私たちの事前は別です。
サイモンクアン

@SimonKuang:はい、あなたは正しいです、私の間違い。残念ながら、現時点ではこれを行う時間はありませんが、これを行う場合は、見つけたものを投稿してください!
S. Kolassa -復活モニカ

14

@soakleyによる答えが機能するかどうかを示す小さなシミュレーション演習:

# Set the number of trials, M
M=10^6
# Set the true mean for each trial
mu=rep(0,M)
# Set the true standard deviation for each trial
sd=rep(1,M)
# Set counter to zero
count=0
for(i in 1:M){
 # Control the random number generation so that the experiment is replicable 
 set.seed(i)
 # Generate one draw of a normal random variable with a given mean and standard deviation
 x=rnorm(n=1,mean=mu[i],sd=sd[i])
 # Estimate the lower confidence bound for the population mean
 lower=x-9.68*abs(x)
 # Estimate the upper confidence bound for the population mean
 upper=x+9.68*abs(x)
 # If the true mean is within the confidence interval, count it in
 if( (lower<mu[i]) && (mu[i]<upper) ) count=count+1
}
# Obtain the percentage of cases when the true mean is within the confidence interval
count_pct=count/M
# Print the result
print(count_pct)
[1] 1

100万回のランダム試行のうち、信頼区間には真の平均が100万回、つまり常に含まれています。信頼区間が95%の信頼区間である場合、これは起こりません。

したがって、式は機能しないようです...または、コーディングを間違えたことがありますか?

(μ,σ)=(1000,1)
0.9500970.95(μ,σ)=(1000,1000)


2
μμ=0

2
α1αsim <- function(rho, n.iter=1e5, sigma=1, psi=9.68) { mu <- runif(n.iter, 0, sigma) * rho; x <- rnorm(n.iter, mu, sigma); mean(p <- abs(x - mu) <= psi * abs(x)) }; sim(1.75)

2
μμμsim(0.1)μ

2
P(Xζ|X|μX+ζ|X|)1αμ

2
μμ=0

0

Edelman、D(1990)「サンプルサイズ1に基づく未知の単峰性分布の中心の信頼区間」を参照してください。TheAmerican Statistician、Vol 44、no4。記事は、正常およびノンパラメトリックのケースをカバーしています。


3
Stats.SEへようこそ。引用した本の要点を含めるために、回答を編集して展開してください。オリジナルのポスターと、このサイトで検索している他の人々の両方にとって、より役立つでしょう。ちなみに、まだ行っていない場合は、Tourに参加してください。LaTeX / MathJaxを使用して、回答方法書式設定のヘルプ、方程式を書き留める方法に関するヒントも参照してください。
Ertxiem-モニカを

私たちのサイト、Davidへようこそ。その記事の著者としてのあなたの貢献(ここでいくつかのスレッドで引用されていると思います)は非常に高く評価されています。
whuber
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.