タグ付けされた質問 「p-value」

頻度主義仮説検定では、 p-valueは、帰無仮説が真であるという仮定の下で、観測された結果よりも極端な(またはそれ以上の)結果の確率です。

3
コンピュータサイエンティストのための統計的仮説検定の優れた導入とは何ですか?
最近、職場でいくつかの統計的仮説検定法(例:フリードマン検定)に曝されたので、このトピックに関する知識を増やしたいと思います。 コンピュータサイエンティストのための統計的有意性/統計的仮説検定への良い導入を提案できますか? PDFブックなどを考えていますが、それ以外のサポートは大歓迎です。 編集:私はすでにこのウェブサイトを見つけましたが、簡単に印刷できるものを探していました。 ありがとう Tunnuz

1
いかがですか
私は統計学の真新しいので、分割テスト(A / Bおよび多変量)の背後にある数学を勉強しています。与えられたテストデータを使用してを計算する方法を学びました。これをテーブルを介して確率に変換する方法を理解しましたが、自分で確率を計算できるようにしたいと思います。オンラインでいくつかの説明を読みましたが、理解できません。χ2χ2\chi^2 これを分解するリソースまたは本を誰か知っていますか?

2
正確な検定では常に、近似検定よりも高いP値が得られますか?
その上でmcnemarテストのシミュレーションを実行しましたが、答えは「はい」のようでした。 これは常に、正確なP値が近似によって到達したp値よりも高い(または小さくない)場合であると言えるのではないかと思っていました。 たとえばいくつかのコード: set.seed(234) n <- 100 # number of total subjects P <- numeric(100) P_exact <- numeric(100) for(i in 1:100) { x = table(sample(1:2, n, T), sample(1:2, n, T)) P[i] <- mcnemar.test(x, correct = F)$p.v P_exact[i] <- binom.test(x[2,1],x[1,2]+x[2,1])$p.valu } #for different n - the level of problem is worse …

1
帰無仮説の棄却がなぜ検察官の誤りのケースではないのですか?
これが私の理解です: p値-調査質問の帰無仮説(H0)が真の場合に、観測された、またはより極端な結果を見つける確率 つまり、p-valueです。ここで、p値が特定のしきい値()を下回ると、帰無仮説を棄却します。=P(evidence/nullhypothesis)=P(evidence/nullhypothesis)=P(evidence/nullhypothesis)alphaalphaalpha 私はここで非常に基本的な何かを見逃していることを知っていますが、検察官の誤謬を犯した場合ではなく、帰無仮説が真実であるという証拠である可能性が低いことに基づいて帰無仮説を拒否するのはどうですか?

3
重回帰における個々のp値の帰無仮説は何ですか?
2つの独立変数とに基づく従属変数線形回帰モデルがあるので、一般的な形式の回帰方程式があります。YYYX1バツ1X1X2バツ2X2 Y=A+B1⋅X1+B2⋅X2+ϵY=あ+B1⋅バツ1+B2⋅バツ2+εY = A + B_1 \cdot X_1 + B_2 \cdot X_2 + \epsilon、 どこ AあA 切片です ϵε\epsilon はエラー項であり、 B1B1B_1 そして B2B2B_2 はそれぞれの係数です X1バツ1X_1 そして X2バツ2X_2。ソフトウェア(Pythonのstatsmodel)で重回帰を実行し、モデルの係数を取得します。A=a,B1=b1,B2=b2あ=a、B1=b1、B2=b2A = a, B_1 = b_1, B_2 = b_2。モデルはまた、各係数の値を与えます:、、および。私の質問は、これらの個々の値の帰無仮説は何ですか?たとえば、を取得するには、帰無仮説が係数0を伴うことを知っていますが、他の変数についてはどうですか?つまり、帰無仮説がである場合、の値が導出される帰無仮説のおよび値は何ですか?ppppapap_ap1p1p_1p2p2p_2pppp1p1p_1B1B1B_1Y=A+0⋅X1+B2⋅X2Y=あ+0⋅バツ1+B2⋅バツ2Y = A + 0 \cdot X_1 + B_2 \cdot X_2AあAB2B2B_2pppB1B1B_1

1
古典的な感覚と主観的な感覚の両方の確率を同時に考えることはできますか?
私は統計学の学生です。私は、確率の古典的かつ客観的な定義と、それらが頻出主義およびベイズの推論とどのように関連しているかを理解しようとしています。なぜ古典確率が頻出推論と対になるのか、ベイズ推論が主観確率と対になるのかは私には明らかではありません。一部のソースでは、Wellekによるこのペーパーから次のようなステートメントを読みました(申し訳ありませんが、ペイウォールの背後にないバージョンは見つかりませんでした)。 頻度主義の観点から見ると、母集団パラメーターは、意味のある確率ステートメントを作成できない観測不可能な定数です。 これが繰り返し試行としての確率の古典的な定義によるのか、それとも頻出主義推論の制約によるのかを理解しようとしています。 私の特定の質問は、読者が先にスキップすることを好む場合は最後にありますが、それが役立つ場合に備えて私の考えを共有したいと思いました。 確率変数考えます。である確率を科学的に経験的に測定したい場合、古典的な確率の定義では、実験を何度も繰り返して集計する必要があると思います。主観的な定義から、私はまず自分自身の信念または合理的なエージェントの信念に相談することが期待されていると思います。私がより多くのデータを収集すると、それらの信念は合理的に変更されます。XXXP(X=x)P(X=x)P(X=x) 今では、は観測できないように思われるので、私の古典的な経験的手順で値を計算する方法はありません。対照的に、私はように直接観察できないものを常に信じることができるため、ように観察できるものとように観察できないものとの関係を知っていると仮定すると、これによって信念を持つことができます私は合理的に時間をかけて変更することができました。H0|XH0|XH_0|XP(H0|X)P(H0|X)P(H_0|X)H0|XH0|XH_0|XXXXH0H0H_0P(H0|X)P(H0|X)P(H_0|X) 私は、にとって、は宇宙の固定プロパティであると主張することもできます。そのため、たとえ観察できたとしても、は固定であるという考えに行き詰まっているかもしれません。しかし、コインを投げるという典型的な実験について考えて、それを変更して、私には大量のクォーターがあり、フリップを記録するたびに常に新しいものを使用すると言ったとしたらどうでしょう。したがって、その場合、基になるパラメーターがコイン固有であると思われますが、直接観察することはできません。したがって、は意味がありますが、を直接観察して計算することはできません。H0H0H_0H0H0H_0pppP(p=0.5|X)P(p=0.5|X)P(p=0.5|X)ppp だから私のハイレベルの質問に戻ります。 ベイジアン推論手順を頻出者として解釈する意味のある方法はありますか? 確率が確率の古典的な定義に従って定義されているベイジアン推論を行う意味のある方法はありますか?

2
ランダムな予測子を使用したロジスティック回帰から均一なp値分布が得られないのはなぜですか?
以下のコードは、周囲に二項ノイズを含む一連の「信号」確率で構成されるテストデータのセットを生成します。次に、コードは5000組の乱数を「説明的な」系列として使用し、それぞれについてロジスティック回帰のp値を計算します。 ランダムな説明シリーズは、57%のケースで5%レベルで統計的に有意であることがわかりました。以下の投稿の長い部分を読んだ場合、これはデータに強い信号が存在することに起因します。 だから、ここに主な質問があります:データに強い信号が含まれているときに説明変数の統計的有意性を評価するときに、どの検定を使用すべきですか?単純なp値は誤解を招くようです。 問題の詳細な説明は次のとおりです。 予測子が実際には単なる乱数のセットであるときに、ロジスティック回帰のp値を取得した結果に戸惑っています。私の最初の考えは、この場合、p値の分布はフラットでなければならないということでした。以下のRコードは、実際には低いp値で大きなスパイクを示しています。これがコードです: set.seed(541713) lseries <- 50 nbinom <- 100 ntrial <- 5000 pavg <- .1 # median probability sd <- 0 # data is pure noise sd <- 1 # data has a strong signal orthogonalPredictor <- TRUE # random predictor that is orthogonal to the true …

1
多くのメタ分析の結果を組み合わせた後の神経科学における低出力の意味(Button et al 2013)
Nature Neuroscienceの2013年のレビュー記事で、Button et al。停電:小さなサンプルサイズは、神経科学の信頼性を損なう理由は、それがあると述べました。 神経科学の研究の平均統計力は非常に低い 彼らはメタ分析を検索し、それぞれのポストホックパワーを計算し、中央値のポストホックパワーを取ることによって結果を組み合わせました。中央値は20%でした。わかりません。事後電力は、常に本質的に達成されたp値に関連付けられています。中央値のp値が〜0.3のようなもので、ポストホックパワーが20%であることを記述するのと同じではないでしょうか。 では、基本的に、この結果はどのように神経科学の研究の質を損なうのでしょうか?彼らは多くの有意でないp値を用いた研究を発表しているようです。 このレビューは非常に有名な著者によるNature Neuroscienceの研究なので、私の解釈には欠陥がある可能性が高いと思います。 編集:名目上の有意性のある研究のみが含まれているとしたら、ある点がわかるでしょう。その場合、中央値パワーは、重要な発見の中央値複製確率を示します。

1
p値の信頼区間はどのくらいですか?
-値は、我々は仮説に対して推定することができますどのように強力に報告するために使用されます。明らかなように、この値自体はデータから推定され、同じ条件で収集された新しいデータの場合、新しい値が同じになることはほとんどありません。ppppppppp Nature Methodsの解説におけるHalsey、Curran-Everett、Vowler&Drummond(2015)は、値を取り巻く不確実性がかなり大きくなる可能性があることを示しました。返信で、Lazzeroni、Lu&Belitskaya-Lévy(2016、同じジャーナル)は、信頼区間が0.00000008から0.99になる0.049の観測された値の例を示しました。pppppp 私の質問は、値の標本分布を知っていますか?後者によれば、サンプルサイズには依存しません(これらはすべてテスト統計を「標準化」するために使用されるため、おそらくサンプルの標準偏差に依存します)。おそらく、それはテスト手順に依存する可能性がありますか?ppp 私があればということを知っている真である、の分布 -値が1の範囲0にわたって均一である(しかし、私はこのことを学んだ場所を覚えていないことができます)。ますます不十分である、の分布 -値(左テール試験用)0%確率上傾い、峰となります。H0H0H_0pppH0H0H_0ppp ブートストラップを使用すると、値の分布を視覚的に表現するのがかなり簡単になります。ただし、より満足のいく答えは、どのような特性がその分布に影響を与えるかを正確に把握できるようにするための式(閉形式はさらに優れている)になることです。これにより、信頼区間の幅が決まります。ppp あなたはそのような式を知っていますか、あるいはそれを持つことさえ可能ですか?

1
ベイジアンp値にデータに加えてパラメーターが含まれるのはなぜですか?
Gelmanのベイジアンデータ分析の146ページで、Gelmanはモデルの適合性をチェックする方法としてベイジアンp値について説明しています。アイデアは、観測データ()を、実験を再現した場合にモデルによって生成された可能性のあるデータ()と比較することです。yyyyrepyrepy^{rep} 彼はベイジアンp値を次のように定義しています。 pB=Pr(T(yrep,θ)≥T(y,θ)|y)pB=Pr(T(yrep,θ)≥T(y,θ)|y) p_B = Pr(T(y^{rep}, \theta) \geq T(y, \theta) | y) テスト統計をパラメーターの関数であるにするのが理にかなっている理由がよくわかりません。実際、目標が「観測されたデータとモデルによって生成された可能性のあるデータとの比較」である場合、比較は厳密にと間で行われるべきではありませんか?θθ\thetayyyyrepyrepy^{rep} たとえば、同じページのGelmanは、通常のモデルの適合性をチェックする例を提供しています。テスト統計は次のとおりです。 T(y,θ)=|y(61)−θ|−|y(6)−θ|T(y,θ)=|y(61)−θ|−|y(6)−θ| T(y, \theta) = | y_{(61)} - \theta | - |y_{(6)} - \theta | ここで、は通常のモデルの平均です。この検定統計量は、6次および61次の統計量を超えて、極端な尾でのモデルの適合を無視するように設計されています。θθ\theta 代わりに次の検定統計量を使用して、純粋にデータに依存しないのはなぜですか? T(y,θ)=|y(61)−y¯|−|y(6)−y¯|T(y,θ)=|y(61)−y¯|−|y(6)−y¯| T(y, \theta) = | y_{(61)} - \bar y | - |y_{(6)} - \bar y |

2
非正規性に対する相関テストのロバスト性
ピアソンの相関検定統計の非正規性に対する堅牢性について、一見逆の2つのステートメントを調整しようとしています(nullは「相関なし」を意味します)。 このCVの答えは言う: 非常に堅牢ではありません。 このバイオスタットハンドブックには次のように書かれています。 [...]多数のシミュレーション研究により、線形回帰と相関は非正規性の影響を受けないことが示されています。一方または両方の測定変数は非常に非正規である可能性があり、偽陽性の確率(帰無仮説が真の場合はP <0.05)は依然として約0.05です(EdgellおよびNoon 1984、およびその参照)。 何が欠けていますか?
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.