タグ付けされた質問 「p-value」

頻度主義仮説検定では、 p-valueは、帰無仮説が真であるという仮定の下で、観測された結果よりも極端な(またはそれ以上の)結果の確率です。

1
GAM P値を解釈する方法は?
私の名前はヒューです。私は博士課程の学生で、一般的な加法モデルを使用して探索的分析を行っています。 MGCVパッケージからのp値をどのように解釈し、理解を確認したいのかわかりません(バージョン1.7-29を使用しており、Simon Woodのドキュメントをいくつか参照しました)。最初に他のCVの質問を探しましたが、最も関連性の高い質問は一般的な回帰に関するものであり、特にGAMのp値ではないようです。 GAMにはさまざまな引数がたくさんあり、p値はあくまでも概算です。しかし、私は単純に始めて、私の共変量に「シグナル」があるかどうかを確認しています。例えば: Y〜s(a、k = 3)+ s(b、k = 3)+ s(c、k = 3)+ s(d、k = 3)+ s(e、k = 3) 滑らかな項の近似p値: s(a)= 0.000473 s(b)= 1.13e-05 s(c)= 0.000736 s(d)= 0.887579 s(e)= 0.234017 R²(調整済み)= 0.62\quad 逸脱の説明= 63.7% GCVスコア= 411.17\quad スケール推定= 390.1\quad n = 120 書式設定により、df列などを切り取りました。各共変量のp値を、対応する滑らかな関数がモデルの逸脱を大幅に低減するかどうかのテストとして解釈しています。ここで、pは、0のnullモデルで観察されるものと少なくとも「比較的妥当でない」データを取得する確率です。 これは、(たとえばalpha = 0.05を使用して)平滑化された関数が "d"および "e"とnullモデルの偏差を減少させなかったのに対し、他の項については減少させたことを意味します。したがって、(d)と(e)は回帰に重要な情報を追加せず、説明された逸脱は(a)(b)(c)に下がっていますか? 助言をいただければ幸いです。また、幸運にも研究にご協力ください。
10 p-value  mgcv 

2
lme4を使用した混合効果モデルの交互作用項のP値
私はを使用lme4していくつかの行動データを分析していますがR、主にBodo Winterの優れたチュートリアルに従っていますが、インタラクションを適切に処理しているかどうかわかりません。さらに悪いことに、この研究に関与している他の誰も混合モデルを使用していないので、物事が正しいことを確認することに関して、私は少しドリフトしています。 助けを求める叫びを投稿するのではなく、私は問題を解釈するために最善の努力をし、それからあなたの集団的な修正を頼むべきだと思いました。他のいくつかのサイドは次のとおりです。 執筆中に、この質問を見つけました。nlme相互作用項のp値をより直接的に与えることを示していますが、との関係で尋ねることは依然として有効だと思いますlme4。 Livius'この質問への回答には、今後数日で読み進めようとする追加の読み物へのリンクが含まれているので、進展があった場合はコメントします。 私のデータでは、私は、従属変数持ちdv、condition操作(高になるはずである0 =制御、1 =実験条件、dv)、また、ラベルされた前提条件、appropriateコード化された臨床試験:1このためには、効果を示す必要がありますが、試験がコード化された0かもしれないが重要な要素がないためです。 また、各対象内の、および解決された14の各問題内の相関値を反映するsubject、およびの2つのランダムな切片も含めました(各参加者は、各問題のコントロールバージョンと実験バージョンの両方を解決しました)。targetdv library(lme4) data = read.csv("data.csv") null_model = lmer(dv ~ (1 | subject) + (1 | target), data = data) mainfx_model = lmer(dv ~ condition + appropriate + (1 | subject) + (1 | target), data = data) interaction_model = lmer(dv ~ condition …

3
ブートストラップ回帰から係数のp値を取得するにはどうすればよいですか?
Robert KabacoffのQuick-Rから # Bootstrap 95% CI for regression coefficients library(boot) # function to obtain regression weights bs <- function(formula, data, indices) { d <- data[indices,] # allows boot to select sample fit <- lm(formula, data=d) return(coef(fit)) } # bootstrapping with 1000 replications results <- boot(data=mtcars, statistic=bs, R=1000, formula=mpg~wt+disp) # view …


1
ブートストラップ有意性検定の2つの方法
ブートストラップを使用して、2つの方法を使用して有意差検定のp値を計算します。 帰無仮説の下でリサンプリングし、元のデータからの結果と少なくとも同じくらい極端な結果をカウントする 対立仮説の下でリサンプリングし、帰無仮説に対応する値と少なくとも元の結果から離れた結果​​をカウントする 最初のアプローチは、p値の定義に従っているため、完全に正しいと思います。2番目についてはよくわかりませんが、通常は非常によく似た結果が得られ、Waldテストを思い出させます。 私は正しいですか?どちらの方法も正しいですか?それらは同じですか(大きなサンプルの場合)? 2つの方法の例(DWinの質問とErikの回答の後に編集): 例1. 2つのサンプルのT検定に似たブートストラップ検定を作成してみましょう。方法1は、1つのサンプルからリサンプリングします(元の2つをプールすることによって取得されます)。方法2では、両方のサンプルから個別にリサンプリングします。 例2.x₁…xₐとy₁…yₐ間の相関のブートストラップテストを作成してみましょう。方法1は、相関がないと仮定し、(xₑ、yₔ)ペアを考慮してリサンプリングします。ここでe≠əです。方法2は、元の(x、y)ペアのブートストラップサンプルをコンパイルします。 例3.コインが公正かどうかを確認するブートストラップテストを作成してみましょう。方法1では、Pr(head)= Pr(tail)=½を設定してランダムサンプルを作成します。方法2は、実験的なヘッド/テール値のサンプルをリサンプリングし、比率をtoと比較します。

1
順列テストを使用する利点は何ですか?
検定統計量によって代替仮説に対するいくつかのヌルをテストする場合U(X)U(X)U(X)、ここで、X={xi,...,xn}X={xi,...,xn}X = \{ x_i, ..., x_n\}、の順列の集合を使用して順列検定を適用すると、新しい統計 X T (X ):= #{ π ∈ G :U (π X )≥ U (X )}GGGXXXT(X):=#{π∈G:U(πX)≥U(X)}|G|.T(X):=#{π∈G:U(πX)≥U(X)}|G|. T(X) := \frac{\# \{\pi \in G: U(\pi X) \geq U(X)\}}{|G|}. 順列検定を使用しない場合と比べて、順列検定を使用する利点は何ですか?つまり、順列テストが機能するときはどのようなものですか? それを実現するための条件は何ですか?検定統計量および/または帰無仮説に関するいくつかの条件など?UUU 例えば、 サンプル場合、 は基づくp値と等しい必要がありますか?はいの場合、なぜですか?(参照も高く評価されています)U (X )XT(X)T(X)T(X)U(X)U(X)U(X)XXX のp値は、。順列検定がU(X)の順列分布を推定する場合| X = x、T(X)はX = xでのU(X)の p値とどのように等しいですか?特に、ヌルHには複数の分布が存在する可能性があり、T(X)はヌル分布を1つずつ考慮せず、\ sup_ {F \ in H}と\ …

6
p値を使用して、仮説が真である確率を計算します。他に何が必要ですか?
質問: p値についてよくある誤解の1つは、帰無仮説が真である確率を表しているということです。私はそれが正しくないことを知っています。また、帰無仮説が真である場合、p値はこれと同じくらい極端なサンプルを見つける確率を表すだけであることを知っています。しかし、直感的には、後者から最初のものを導出できるはずです。誰もこれをしていない理由があるに違いない。p値と関連データから仮説が真である確率を導き出すことを制限する、どのような情報が欠けているのでしょうか? 例: 私たちの仮説は「ビタミンDは気分に影響を与える」です(帰無仮説は「影響なし」です)。1000人で適切な統計調査を行い、気分とビタミンレベルの相関関係を見つけたとします。他のすべてのものが等しい場合、0.01のp値は、0.05のp値よりも真の仮説の可能性が高いことを示します。たとえば、p値が0.05であるとします。仮説が真である実際の確率を計算できないのはなぜですか?どのような情報が不足していますか? 頻度主義統計学者のための代替用語: 私の質問の前提を受け入れるなら、ここを読むのをやめることができます。以下は、仮説が確率解釈を持つ可能性があることを受け入れない人のためのものです。少し用語を忘れましょう。代わりに... 友達と賭けているとしましょう。あなたの友人はあなたに無関係な主題についての千の統計的研究を示します。各スタディでは、p値、サンプルサイズ、およびサンプルの標準偏差のみを確認できます。それぞれの研究について、あなたの友人はあなたに、研究で提示された仮説が真実であると賭ける確率を提供します。賭けをするかしないかを選択できます。1000件すべての研究に賭けをした後、オラクルがあなたに上って、どの仮説が正しいかを教えてくれます。この情報により、賭けを清算することができます。私の主張は、このゲームに最適な戦略があるということです。私の世界観では、これは仮説の確率が真であることを知ることと同じですが、私たちが同意しない場合は問題ありません。その場合、賭けの期待を最大化するためにp値を使用する方法について簡単に話すことができます。

1
モデル選択におけるAICとp値の同等性
この質問の回答に対するコメントで、モデル選択でAICを使用することは、0.154のp値を使用することと同等であると述べられました。 私はそれをRで試しました。「後方」サブセット選択アルゴリズムを使用して、完全な仕様から変数をスローしました。1つ目は、p値が最も高い変数を順次スローし、すべてのp値が0.154を下回ったときに停止します。次に、変数を削除して、改善が見られなくなるまで削除すると、AICが最も低くなります。 0.154のp値をしきい値として使用しても、ほぼ同じ結果になることがわかりました。 これは本当ですか?もしそうなら、誰もが理由を知っていますか、それを説明する情報源を参照できますか? PS登録したばかりなので、コメントを書いたり、コメントを書いたりすることができませんでした。これはモデルの選択や推論などに最適なアプローチではないことを認識しています。

2
0.05 <p <0.95の結果が偽陽性と呼ばれるのはなぜですか?
編集:私の質問の根拠には欠陥があり、それが意味をなすように作成できるかどうかを判断するために、少し時間を費やす必要があります。 編集2: p値が帰無仮説の確率の直接的な尺度ではないことを認識していますが、p値が1に近いほど、仮説が対応する帰無仮説が真である実験的テストに選択されましたが、p値が0に近いほど、対応する帰無仮説が偽である実験的テストに仮説が選択されている可能性が高くなります。すべての仮説のセット(または実験のために選択されたすべての仮説)が何らかの方法で病理的でない限り、これがどのように間違っているかはわかりません。 編集3:質問に明確な用語を使用していません。宝くじの番号が読み取られ、チケットと1つずつ照合すると、何かが変わります。勝った確率は変わりませんが、ラジオをオフにできる確率は変わります。実験が行われたときにも同様の変化が起こりますが、私が使用している用語「p値は、真の仮説が選択される可能性を変える」というのは正しい用語ではないと感じています。 編集4:私が取り組むべき豊富な情報を含む2つの驚くほど詳細で有益な回答を受け取りました。私は今、両方に投票し、両方の回答から十分に学習して、質問に答えたか無効にしたことを知ったときに、どちらか1つを受け入れます。この質問は、私が予想していたものよりもはるかに大きなワームの缶を開きました。 私が読んだ論文では、検証後に「偽陽性」と呼ばれるp&gt; 0.05の結果を見てきました。ただし、実験データのap &lt;0.50は低いが&gt; 0.05であり、帰無仮説と非仮説の両方ではない場合に、対応する偽の帰無仮説でテストする仮説を選択した可能性が高いのではないでしょうか。研究仮説統計学的に不確実な/の些細な(従来の統計的有意性のカットオフを与えられた)は、p &lt;&lt;0.05の間のどこか0.95のpの逆数&lt;0.05は、非対称性がNickStaunerの@に指摘与えられ、あるものは何でもリンク? その数値をAと呼び、p値として定義します。これは、実験/分析で真の帰無仮説を選択した可能性について同じことを示し、p値0.05は、 veは、実験/分析のために真の非帰無仮説を選びました。0.05 &lt;p &lt;ではない、「サンプルサイズが質問に答えるほど大きくなかったため、より大きなサンプルを取得して統計を得るまで、アプリケーション/現実世界の重要性を判断することができません。意味が整理されましたか?」 言い換えれば、p&gt; Aの場合に限り、(単にサポートされていないのではなく)結果を完全にfalseと呼ぶのが正しいのではないでしょうか? これは私には簡単に思えますが、そのような広範囲にわたる使用法は、私が間違っている可能性があることを示しています。私は: a)数学の誤解、 b)無害で正確ではない慣例についての不満、 c)完全に正しい、または d)その他? これは意見の募集のように聞こえますが、これは明確な数学的に正解の回答のように(有意性の切り捨てが設定された後)、私または(ほとんど)全員が間違っている問題のようです。

1
ロジスティック回帰モデル変数のp値の意味
だから私はRでロジスティック回帰モデルを使っています。統計はまだ初めてですが、回帰モデルについて少し理解できたように思いますが、それでも気になることがいくつかあります。 リンクされた画像を見ると、私が作成したサンプルモデルのRプリントの概要が表示されています。このモデルは、データセット内の電子メールがrefoundか(バイナリ変数される場合は、予測しようとしているisRefound)とデータセットが密接に関連する2つの変数が含まれているisRefound、すなわち、next24およびnext7daysこれらはまた、バイナリであり、メールが次にクリックされる場合は教えてくれ- 24時間/ログの現在のポイントから次の7日間。 高いp値は、この変数がモデル予測に与える影響がかなりランダムであることを示しているはずですよね?これに基づいて、これらの2つの変数が計算式から外されている場合、モデル予測の精度が10%未満に低下する理由がわかりません。これらの変数の重要度が非常に低い場合、それらをモデルから削除すると大きな影響があるのはなぜですか? よろしくお願いします、リッキーフォックス 編集: 最初に私はnext24だけを削除しましたが、これはcoefがかなり小さいので影響が少ないはずです。予想通り、ほとんど変更されていません-そのための写真をアップロードしないでください。 next7daysを削除すると、モデルに大きな影響がありました:AIC 200kアップ、精度16%まで、再現率73%まで

1
不明なp値の計算
私は最近Rスクリプトをデバッグしていて、非常に奇妙な何かを見つけました、著者は独自のp値関数を定義しました pval &lt;- function(x, y){ if (x+y&lt;20) { # x + y is small, requires R.basic p1&lt;- nChooseK(x+y,x) * 2^-(x+y+1); p2&lt;- nChooseK(x+y,y) * 2^-(x+y+1); pvalue = max(p1, p2) } else { # if x+y is large, use approximation log_p1 &lt;- (x+y)*log(x+y) - x*log(x) - y*log(y) - (x+y+1)*log(2); pvalue&lt;-exp(log_p1); } return(pvalue) …

3
仮説検定。サンプリング分布をH0に集中させるのはなぜですか?
p値は、帰無仮説()が真であると仮定した場合に、サンプルデータで観測された統計と少なくとも同じくらい極端な統計を取得する確率です。H0H0H_0 これは、仮定した場合に取得されるであろうサンプリング分布の下のサンプル統計によって定義された領域にグラフィカルに対応し。H0H0H_0 ただし、この想定される分布の形状は実際にはサンプルデータに基づいているため、を中心とする分布は私には奇妙な選択のように思えます。 代わりに統計の標本分布を使用する場合、つまり標本統計に分布を集中させる場合、仮説検定は標本が与えられた場合のの確率の推定に対応します。μ 0μ0μ0\mu_0μ0μ0\mu_0 その場合、p値は、上記の定義の代わりに、データが与えられたときにと少なくとも同じくらい極端な統計を取得する確率です。μ0μ0\mu_0 さらに、このような解釈には信頼区間の概念によく関連するという利点があります。 有意水準仮説検定は、がサンプリング分布の信頼区間内にあるかどうかを確認することと同等です。μ 0(1 - α )αα\alphaμ0μ0\mu_0(1−α)(1−α)(1-\alpha) したがって、分布をせることは、不必要に複雑になる可能性があると感じています。 私が考慮しなかったこのステップの重要な正当化はありますか?μ0μ0\mu_0

1
ベイジアンp値とは何ですか?
私は、頻出のp値を理解しているが、統計に対するベイジアンアプローチの基礎を理解しているだけの読者を満足させる答えを探しています。 現在のところ、グーグル検索では、ウィキペディアのページや他の一般に受け入れられているリソースの定義は明らかにされていません。 この質問は関連しているようですが、ユーザーが実際にベイズのp値を計算していないことが判明したため、実際にはそうではありません。ただし、受け入れられた回答は、ベイズのp値とは何かを説明するこのゲルマン論文にリンクしています。


1
-2対数尤度は1つのモデルのみで計算できますか?
このglmfit関数をMATLABで使用しています。この関数は、逸脱度のみを返し、対数尤度は返しません。逸脱は基本的にモデルの対数尤度の違いの2倍であることを理解していますがglmfit、1つのモデルを作成するためだけに使用しているのではなく、どういうわけか逸脱が発生しています。 -2対数尤度の計算には2つのモデルが必要ですか? モデルが1つしかない場合、逸脱をどのように分析できますか? 私が持っているもう1つの質問は、2つのモデルがあり、対数尤度検定を使用してそれらを比較していたということです。帰無仮説は最初のモデルであり、対立仮説は2番目のモデルです。対数尤度検定の統計を取得した後、それをカイ二乗cdfと照合してp値を決定しますか?アルファレベルよりも小さい場合はnullを拒否し、それよりも大きい場合はnullを拒否できません。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.