タグ付けされた質問 「confidence-interval」

信頼区間は、信頼度で未知のパラメーターをカバーする区間です。信頼区間は、頻度主義の概念です。それらは、ベイジアンアナログである信頼できる間隔と混同されることがよくあります。 (1α)%


12
95%信頼区間(CI)が95%の平均を含む可能性を意味しないのはなぜですか?
ここで関連するさまざまな質問を通じて、「95%信頼区間」と呼ばれる「95%」の部分は、サンプリングとCI計算の手順を何度も正確に複製するという事実に言及しているというコンセンサスがあるようです。 、こうして計算されたCIの95%に母平均が含まれます。また、この定義はそうではないというコンセンサスのようです単一の95%CIから、平均がCI内のどこかに落ちる可能性が95%あると結論付けることを許可します。ただし、95%の人口が人口の平均を含むと多くのCIを想像している限り、前者が後者を暗示していないことを理解していません(実際に計算されたCIが人口を含むかどうかに関して意味するかどうか)想像されるケースのベースレート(95%)を、実際のケースにCIが含まれる確率の推定値として使用することを強制しますか? 「実際に計算されたCIには母集団の平均が含まれているか含まれていないため、確率は1または0である」という行に沿って議論している記事を見ましたが、これは依存する確率の奇妙な定義を暗示しているようです未知の状態(つまり、友人が公正なコインを裏返し、結果を非表示にし、50%の可能性があると言ってはいけません)。 確かに私は間違っていますが、私のロジックがどこでおかしくなったのかわかりません...

3
「単純なブートストラップ」が失敗する例は何ですか?
未知の分布または複雑な分布からのサンプルデータのセットがあり、データの統計に対して何らかの推論を実行するとします。私のデフォルトの傾きはちょうど交換とブートストラップサンプルの束を生成し、そして私の統計を計算することであるための推定分布を作成するために、各ブートストラップ標本に。TTTTTTTTT これが悪い考えである例は何ですか? たとえば、このブートストラップの単純な実行が失敗する場合の1つは、時系列データでブートストラップを使用しようとしている場合です(たとえば、重要な自己相関があるかどうかをテストするため)。上記のナイーブブートストラップ(元のシリーズからの置換でサンプリングすることにより、n番目のブートストラップサンプルシリーズの番目のデータポイントを生成)は、元の時系列の構造を無視するため、お勧めできません。ブロックブートストラップのような、より手の込んだブートストラップテクニックを取得します。iii 別の言い方をすれば、「置換によるサンプリング」以外にブートストラップには何がありますか?

9
正確には、信頼区間とは何ですか?
信頼区間とは何かを大まかに非公式に知っています。しかし、かなり重要な詳細に頭を包み込むようには思えません。ウィキペディアによると: 信頼区間は、実際に取得されたデータが与えられた場合、パラメーターの真の値が信頼区間にある特定の確率を持っているとは予測しません。 また、このサイトのいくつかの場所で同様の指摘がありました。ウィキペディアからのより正確な定義は次のとおりです。 繰り返された(および場合によっては異なる)実験の多くの別個のデータ分析にわたって信頼区間が構築される場合、パラメーターの真の値を含むそのような区間の割合は、信頼レベルとほぼ一致します。 繰り返しになりますが、私はこのサイトのいくつかの場所で同様の指摘をしました。わかりません。繰り返し実験の下で、真のパラメーターを含む計算された信頼区間の割合がである場合、実際の実験で計算されたが信頼区間にある確率は?私は答えで次を探しています:(1 - α )θ (1 - α )θθ\theta(1−α)(1−α)(1 - \alpha)θθ\theta(1−α)(1−α)(1 - \alpha) 上記の誤った定義と正しい定義の区別の明確化。 最初の定義が間違っている理由を明確に示す、信頼区間の正式で正確な定義。 基礎となるモデルが正しい場合でも、最初の定義が劇的に間違っている場合の具体例。

6
ベイズの信頼できる区間が明らかに頻度の高い信頼区間よりも低い例はありますか
信頼と信頼できる間隔の違いに関する最近の質問から、私はそのトピックに関するエドウィンジェーンズの記事を読み直すことになりました。 ジェインズ、ET、1976年。「信頼区間対ベイジアン区間」、確率理論、統計的推論、および科学の統計理論の基礎、WL HarperおよびCA Hooker(eds。)、D。Reidel、Dordrecht、p。175; (pdf) 要約では、Jaynesは次のように書いています。 ...信頼区間に関連する6つの一般的な統計問題(同じ推論に基づく有意性検定を含む)に対するベイジアンおよび正統解を示します。いずれの場合も、状況はまったく逆であることがわかります。つまり、ベイジアン法の方が適用が簡単で、同じまたはより良い結果が得られます。実際、オーソドックスな結果は、ベイジアンの結果と密接に(または正確に)一致する場合にのみ満足のいくものです。反対の例はまだ作成されていません。 (エンファシス鉱山) この論文は1976年に出版されたので、恐らく物事は進んでいるでしょう。私の質問は、頻繁な信頼区間がベイジアンの信頼区間より明らかに優れている例はありますか(Jaynesによって暗黙的に行われた挑戦による)。 誤った事前仮定に基づく例は、異なるアプローチの内部一貫性について何も述べていないため、受け入れられません。


4
心理学誌は、p値と信頼区間を禁止しました。それらの使用をやめるのは本当に賢明ですか?
2015年2月25日に、ジャーナルBasic and Applied Social Psychology は、将来のすべての論文から値と信頼区間を禁止する社説を発行しました。ppp 具体的には、彼らは言う(フォーマットと強調は私のものです): [...]出版前に、著者はNHSTPのすべての痕跡を削除する必要があります[null仮説の有意性検定手順](値、値、値、「有意な」差異またはその欠如に関する記述、 等々)。ppptttFFF NHSTPが棄却の強力なケースを提供するために必要な帰無仮説の確率の提供に失敗する方法と同様に、信頼区間は対象の母集団パラメーターが指定された範囲内にあると結論付けるための強力なケースを提供しません間隔。したがって、信頼区間もBASPから禁止されています。 [...]ベイジアンの手順に関して、私たちはケースバイケースの判断を行う権利を留保します。したがって、ベイジアンの手順はBASPに必要でも禁止でもありません。 [...]推論統計手順は必要ですか?- いいえ [...]ただし、BASPでは、効果の大きさなどの強力な記述統計が必要です。 ここで、値の問題と誤用については説明しません。p-valueタグを参照すると、CVに関する優れた議論がたくさんあります。値の批判は、多くの場合、関心のあるパラメーターの信頼区間を報告するためのアドバイスと一緒になります。たとえば、この非常によく議論された回答では、 @ gungは、効果のサイズとその周囲の信頼区間を報告することを提案しています。しかし、このジャーナルは信頼区間も禁止しています。pppppp 値、信頼区間、および重要/重要でない二分法による「従来の」アプローチとは対照的に、データと実験結果を提示するこのようなアプローチの利点と欠点は何ですか?この禁止に対する反応はほとんど否定的なようです。それでは、欠点は何ですか?アメリカ統計協会は、この禁止について、「この政策はそれ自体の否定的な結果をもたらすかもしれない」と言って、簡単な落胆的なコメントを投稿しました。これらの負の結果は何でしょうか?ppp または、@ whuberが提案したように、このアプローチは一般的に定量的研究のパラダイムとして提唱されるべきですか?もしそうでなければ、なぜですか? PS。私の質問は禁止自体に関するものではないことに注意してください。それは提案されたアプローチについてです。私は、頻度論者対ベイジアン推論についても尋ねていません。エディトリアルは、ベイジアン手法についてもかなり否定的です。したがって、基本的には統計を使用することと、統計をまったく使用しないことです。 その他の議論:reddit、Gelman。

8
既存の変数と定義された相関関係を持つランダム変数を生成します
シミュレーション研究のために、既存の変数に対する事前定義された(母集団)相関を示すランダム変数を生成する必要があります。YYY 私は、に見えたRパッケージcopulaとCDVine特定の依存構造を持つランダムな多変量分布を生成することができました。ただし、結果の変数の1つを既存の変数に修正することはできません。 アイデアや既存の機能へのリンクを歓迎します! 結論: さまざまなソリューションで、2つの有効な答えが出ました。 カラカルによるR スクリプト。事前定義された変数との正確な(サンプル)相関を持つランダム変数を計算します 事前定義された変数に対する定義された母集団相関を持つランダム変数を計算するR 関数 [@ttnphnsの追加:質問のタイトルを単一の固定変数の場合から任意の数の固定変数に拡大するために自由を取りました。すなわち、いくつかの固定された既存の変数と事前定義された相関を持つ変数を生成する方法]

2
線形回帰の予測値の信頼区間の形状
線形回帰の予測値の信頼区間は、予測値の平均付近で狭くなり、予測値の最小値と最大値付近で太くなる傾向があることに気付きました。これは、次の4つの線形回帰のプロットで見ることができます。 これは、予測子のほとんどの値が予測子の平均値に集中しているためだと当初考えました。ただし、予測変数の多くの値が最小値の周りに集中している左下の線形回帰のように、予測変数の極値の近くに多くの値が集中していても、信頼区間の狭い中央が発生することに気付きました予測子。 線形回帰の予測値の信頼区間が中間で狭く、極端に太くなる傾向がある理由を説明できる人はいますか?

3
xkcd jelly bean comicについて説明してください:何が​​面白いのでしょうか?
私は、彼らが実行さ20回の合計試験のうち一度、ことがわかり、ので、誤った結果が(有意である、20回の試験のうちの1つの間にそれを想定0.05 = 1 / 20)。p &lt; 0.05p&lt;0.05p < 0.050.05 = 1 / 200.05=1/200.05 = 1/20 xkcdジェリービーンコミック-"Significant" タイトル:重要 ホバーテキスト:「だから、ええと、私たちは再び緑の研究を行ったが、リンクは得られなかった。おそらく「-」グリーンジェリービーン/ニキビのリンクに関する研究の混乱。

4
95%の信頼区間内のすべての値が等しく発生する可能性はありますか?
「平均値の差または比率の差の95%信頼区間(CI)を構築する場合、CI内のすべての値は等しく発生する可能性がありますか?または、ポイント推定値が最も発生する可能性があります、CIの「テール」に近い値はCIの中央にある値よりも少ない可能性がありますか? たとえば、特定の治療による死亡の相対リスクが1.06(95%CI 0.96から1.18)であるとランダム化臨床試験レポートに記載されている場合、0.96が正しい値である可能性は1.06と同じですか? この概念に関する多くの参照がオンラインで見つかりましたが、次の2つの例はその中の不確実性を反映しています。 信頼区間に関する Lisa Sullivanのモジュールの状態: 平均の差の信頼区間は、(μ1−μ2μ1−μ2μ_1-μ_2)の可能性のある値の範囲を提供します。信頼区間のすべての値は、(μ1−μ2μ1−μ2μ_1-μ_2)の真の値の推定値である可能性が等しいことに注意することが重要です。 「エラーの範囲内」というタイトルのこのブログ投稿は次のように述べています。 私が念頭に置いているのは、中央限界定理がt分布ではなく有界均一分布を暗示しているかのように、信頼区間内のすべての点を同等に扱う「誤差範囲」についての誤解です。[...] 「エラーのマージン」ミスについて話すことは、ポイント推定値に近い可能性が、マージンの端にある可能性よりもはるかに高いということです。 これらは矛盾しているように見えるので、どちらが正しいですか?

8
(信頼区間が利用可能な場合)仮説検定を教えて使用し続けるのはなぜですか?
なぜ区間推定器がある問題(自信、ブートストラップ、信頼性など)のために、仮説テスト(すべての難しい概念を含み、最も統計的な罪の1つ)を教え、使用し続けるのですか?学生に与えられる最良の説明(もしあれば)は何ですか?伝統だけ?ビューは大歓迎です。

6
ランダムフォレストモデルの予測には予測間​​隔がありますか?
randomForestモデルを実行すると、モデルに基づいて予測を行うことができます。各予測の予測間隔を取得する方法はありますか。その結果、モデルがその答えをどの程度「保証」しているのかがわかります。これが可能である場合、単にモデル全体の従属変数の変動性に基づいているのでしょうか、それとも特定の予測に従ってた特定の決定木に応じて、より広い間隔とより狭い間隔を持っていますか?

6
RのROC曲線を使用して最適なカットオフポイントとその信頼区間を決定する方法は?
正常細胞と腫瘍細胞を区別するために使用できるテストのデータがあります。ROC曲線によると、この目的には適しています(曲線下面積は0.9): 私の質問は: このテストのカットオフポイントと、読み取り値があいまいであると判断される信頼区間を決定する方法 これを視覚化する最良の方法は何ですか(を使用ggplot2)? グラフはROCRとggplot2パッケージを使用してレンダリングされます: #install.packages("ggplot2","ROCR","verification") #if not installed yet library("ggplot2") library("ROCR") library("verification") d &lt;-read.csv2("data.csv", sep=";") pred &lt;- with(d,prediction(x,test)) perf &lt;- performance(pred,"tpr", "fpr") auc &lt;-performance(pred, measure = "auc")@y.values[[1]] rd &lt;- data.frame(x=perf@x.values[[1]],y=perf@y.values[[1]]) p &lt;- ggplot(rd,aes(x=x,y=y)) + geom_path(size=1) p &lt;- p + geom_segment(aes(x=0,y=0,xend=1,yend=1),colour="black",linetype= 2) p &lt;- p + geom_text(aes(x=1, y= 0, hjust=1, …

1
ブートストラップとジャックナイフ
ブートストラップ法とジャックナイフ法の両方を使用して、推定値の偏りと標準誤差を推定することができ、両方のリサンプリング法のメカニズムは大きな違いはありません。ただし、ジャックナイフは、研究と実践においてブートストラップほど人気が​​ありません。 ジャックナイフを使用する代わりにブートストラップを使用することの明らかな利点はありますか?

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.