統計とビッグデータ hypothesis-testing

1

最近の話題の話題は、ジャーナルに投稿された記事からの「帰無仮説統計検定手順（NHSTP）」の使用を禁止するジャーナルに関するものです。一部の作家はこの用語を使用していますが、彼らがどのような区別をしようとしているのか理解できません。NHSTPは、「仮説の検定」または「有意性検定」とは異なるものですか？

9 hypothesis-testing statistical-significance terminology

1

母集団の中央値をテストする方法は？

250ユニットのサンプルがあります。分布は非対称です。母集団の中央値が3.5とは異なるという仮説を検証したいので、1標本検定が適切だと思います。分布が対称的でないため、ウィルコクソン順位検定は適切ではないことを知っています。サインテストは使用に適していますか？それができない場合、誰もが他のテストを推奨できますか？

9 hypothesis-testing median

1

順列検定：検定統計量を選択する基準

私は定期的に順列テストを使用しており、その単純さが大好きです。私は、グッドによる本「リサンプリング手法」から最も多くを学びました。著者は、例全体を通してテスト統計の選択において非常に創造的であるようです。また、この投稿は、検定統計量を選択する大きな自由があるという印象を与えます。テスト統計が従うべき理論的要件があるかどうかはわかりません。それとも、直観的に意味があり、タイプI / IIエラー率が高い限り、任意の統計を使用できますか？たとえば、非正規母集団のためにt検定の代わりに置換検定が使用される場合、置換検定のp値が依然としてt統計から得られることが何度かありました。必ずしも間違っているわけではありませんが、スチューデントt分布の起源を考えると、奇妙な選択のようです。

9 hypothesis-testing permutation-test

3

定期的なデータと定期的なデータを区別するためのテスト

私はいくつかの未知の関数があるとfffドメインと私は継続性のようないくつかの合理的な条件を満たすために知っています、。いくつかの等間隔のサンプリングポイントt_i = t_0 +iΔtとi∈\ {1、…、n \}でのの正確な値を知っています（これはすべてをキャプチャするのに十分細かいと想定できます）fの関連する側面。たとえば、2つのサンプリングポイント間にfの最大1つの極値があると想定できます。私のデータがfに正確に周期的であるかどうかを示すテストを探しています。つまり、∃τ：f（t +τ）= f（t）\、∀\、tRℝℝfffti=t0+iΔtti=t0+iΔtt_i=t_0 + iΔti∈{1,…,n}i∈{1,…,n}i∈\{1,…,n\}fffffffff∃τ:f(t+τ)=f(t)∀t∃τ:f(t+τ)=f(t)∀t∃τ: f(t+τ)=f(t) \,∀\,t、たとえばΔt<τ<n⋅ΔtΔt<τ<n·ΔtΔt < τ < n·Δt（ただし、必要に応じてより強い制約を課すことができると考えられる）など、期間の長さはやや共鳴します。別の観点から見ると、データx0,…,xnx0,…,xn{x_0, …, x_n}あり、f（t_i）= x_i x iであるような周期関数fff（上記の条件を満たす条件）が存在するかどうかの質問に答えるテストを探しています。f(ti)=xi∀if(ti)=xi∀if(t_i)=x_i ∀ i 重要な点は、が少なくとも周期性に非常に近いことです（たとえば、またはと少量ずつのデータポイントを変更するとデータが準拠するために十分である程度に）正確に周期的です。したがって、フーリエ変換やゼロクロッシングの分析などの周波数分析の標準ツールはあまり役に立ちません。ffff(t):=sin(g(t)⋅t)f(t):=sin⁡(g(t)·t)f(t) := \sin(g(t)·t)f(t):=g(t)⋅sin(t)f(t):=g(t)·sin⁡(t)f(t) := g(t)·\sin(t)g′(t)≪g(t0)/Δtg′(t)≪g(t0)/Δtg'(t) ≪ g(t_0)/Δtfff 私が探しているテストはおそらく確率論的ではないことに注意してください。私はそのようなテストを自分で設計する方法をいくつか考えていますが、ホイールの再発明を避けたいです。だから私は既存のテストを探しています。

9 time-series hypothesis-testing exact-test

4

マンホイットニー検定をクラスカル・ウォリス後の事後比較に使用できますか？

動物が敵対的な環境に置かれ、生存のためのいくつかのアプローチを使用してどのくらいの期間生き残ることができるかをシミュレーションするシミュレーションがあります。それが生き残るために使用できる3つのアプローチがあります。私は、各生存アプローチを使用して、動物のシミュレーションを300回実行しました。すべてのシミュレーションは同じ環境で行われますが、ランダム性があるため、毎回異なります。各シミュレーションで動物が生存する秒数を計測します。長生きすることは良いことです。私のデータは次のようになります： Approach 1, Approach 2, Approach 2 45,79,38 48,32,24 85,108,44 ... 300 rows of these この時点以降に何をするかわからないので、私が愚かで間違っていることをしているのかどうかを知らせてください。特定のアプローチを使用して、寿命に統計的な違いがあるかどうかを調べようとしています。各サンプルに対してShapiroテストを実行したところ、小さなp値が返されたため、データが正規化されていないと思います。行のデータは互いに関係がありません。各シミュレーションに使用されるランダムシードは異なりました。その結果、データがペアになっていないと思います。データが正規化されておらず、ペアになっておらず、サンプルが3つ以上あるため、クラスカルウォリス検定を実行しました。p値は0.048でした。次に、ポストホックに移り、Mann Whitneyを選択しました。マンホイットニーをここで使用する必要があるかどうかは本当にわかりません。マンホイットニー検定、つまり{（アプローチ1、アプローチ2）、（アプローチ1、アプローチ3）、（アプローチ2、アプローチ3）}を実行して、各生存アプローチを互いに比較しました。両側検定を使用してペア（アプローチ2、アプローチ3）の間に統計的有意性の所見はありませんでしたが、片側検定を使用して有意差が見つかりました。問題：このようにマンホイットニーを使用することが理にかなっているかどうかはわかりません。私は片側または両側のマンホイットニーを使用する必要があるかどうかわかりません。

9 hypothesis-testing post-hoc wilcoxon-mann-whitney kruskal-wallis dunn-test

2

重要でない効果の周りの狭い信頼区間は、帰無の証拠を提供できますか？

nullを拒否できないということは、nullが真であることを意味すると仮定するのは明らかに誤りです。しかし、ヌルが拒否されず、対応する信頼区間（CI）が狭く、0を中心とする場合、これはヌルの証拠を提供しませんか？私は2つの考えを持っています：はい、実際にはこれは効果が多かれ少なかれ0であるという証拠を提供します。しかし、厳密な仮説テストフレームワークでは、null効果は対応するCIと同様に、推論には単に使用できないようです。では、ポイントの推定値が重要でない場合のCIの意味は何ですか？また、推論には使用できませんか、それとも、前の例のようにnullの証拠を定量化するために使用できますか？学術的参考文献を含む回答は推奨されます。

9 hypothesis-testing statistical-significance confidence-interval

2

0.05 <p <0.95の結果が偽陽性と呼ばれるのはなぜですか？

編集：私の質問の根拠には欠陥があり、それが意味をなすように作成できるかどうかを判断するために、少し時間を費やす必要があります。編集2： p値が帰無仮説の確率の直接的な尺度ではないことを認識していますが、p値が1に近いほど、仮説が対応する帰無仮説が真である実験的テストに選択されましたが、p値が0に近いほど、対応する帰無仮説が偽である実験的テストに仮説が選択されている可能性が高くなります。すべての仮説のセット（または実験のために選択されたすべての仮説）が何らかの方法で病理的でない限り、これがどのように間違っているかはわかりません。編集3：質問に明確な用語を使用していません。宝くじの番号が読み取られ、チケットと1つずつ照合すると、何かが変わります。勝った確率は変わりませんが、ラジオをオフにできる確率は変わります。実験が行われたときにも同様の変化が起こりますが、私が使用している用語「p値は、真の仮説が選択される可能性を変える」というのは正しい用語ではないと感じています。編集4：私が取り組むべき豊富な情報を含む2つの驚くほど詳細で有益な回答を受け取りました。私は今、両方に投票し、両方の回答から十分に学習して、質問に答えたか無効にしたことを知ったときに、どちらか1つを受け入れます。この質問は、私が予想していたものよりもはるかに大きなワームの缶を開きました。私が読んだ論文では、検証後に「偽陽性」と呼ばれるp> 0.05の結果を見てきました。ただし、実験データのap <0.50は低いが> 0.05であり、帰無仮説と非仮説の両方ではない場合に、対応する偽の帰無仮説でテストする仮説を選択した可能性が高いのではないでしょうか。研究仮説統計学的に不確実な/の些細な（従来の統計的有意性のカットオフを与えられた）は、p <<0.05の間のどこか0.95のpの逆数<0.05は、非対称性がNickStaunerの@に指摘与えられ、あるものは何でもリンク？その数値をAと呼び、p値として定義します。これは、実験/分析で真の帰無仮説を選択した可能性について同じことを示し、p値0.05は、 veは、実験/分析のために真の非帰無仮説を選びました。0.05 <p <ではない、「サンプルサイズが質問に答えるほど大きくなかったため、より大きなサンプルを取得して統計を得るまで、アプリケーション/現実世界の重要性を判断することができません。意味が整理されましたか？」言い換えれば、p> Aの場合に限り、（単にサポートされていないのではなく）結果を完全にfalseと呼ぶのが正しいのではないでしょうか？これは私には簡単に思えますが、そのような広範囲にわたる使用法は、私が間違っている可能性があることを示しています。私は： a）数学の誤解、 b）無害で正確ではない慣例についての不満、 c）完全に正しい、または d）その他？これは意見の募集のように聞こえますが、これは明確な数学的に正解の回答のように（有意性の切り捨てが設定された後）、私または（ほとんど）全員が間違っている問題のようです。

9 hypothesis-testing p-value

1

二項分布の2つのサンプルが同じpに準拠しているかどうかをテスト

私がやったとしましょう： n1n1n_1不明な成功率と観察された成功を伴う独立した試験。p1p1p_1k1k1k_1 n2n2n_2不明な成功率と観察された成功を伴う独立した試験。p2p2p_2k2k2k_2 ここで、がまだ不明である場合、特定の（またはその逆）のを観測する確率）は、\ int_0 ^ 1 B（n_1、p、k_1）B（n_2、 p、k_2）\ text {d} p = \ frac {1} {n_1 + n_2 + 1} \ binom {n_1} {k_1} \ binom {n_2} {k_2} \ binom {n_1 + n_2} {k_1 + k_2 } ^ {-1}なので、p_1 \ neq p_2をテストする場合は、観測値が対応する分布のどの分位点であるかを調べるだけで済みます。p1=p2=:pp1=p2=:pp_1 = p_2 =: pp(k2)p(k2)p(k_2)k2k2k_2k1k1k_1∫10B(n1,p,k1)B(n2,p,k2)dp=1n1+n2+1(n1k1)(n2k2)(n1+n2k1+k2)−1∫01B(n1,p,k1)B(n2,p,k2)dp=1n1+n2+1(n1k1)(n2k2)(n1+n2k1+k2)−1\int_0^1 B(n_1,p,k_1) B(n_2, p, …

9 hypothesis-testing binomial references

1

3つのサンプルの比率が等しいかどうかの仮説検定

2列の携帯電話顧客情報データのデータセットがあります。最初の列にはアカウントが該当する特定のカテゴリ（A、B、またはC）が含まれ、2番目の列にはそのアカウントがキャンセルされたかどうかのバイナリ値が含まれます。例えば A | cancelled C | active B | active A | cancelled 私がやりたいのは、アクティブなアカウントとキャンセルされたアカウントでタイプA、B、Cのアカウントの比率が異なるかどうかをテストするためのある種の仮説検定を考え出すことです。帰無仮説はそれらが同じであるというものです。つまり、3つの値に対してこれを行う方法がわからないことを除いて、比率の仮説検定のようなものです。

9 hypothesis-testing equivalence

3

関係が線形か非線形かを確認する統計的検定

次のようなデータセットの例があります。 Volume <- seq(1,20,0.1) var1 <- 100 x2 <- 1000000 x3 <- 30 x4 = sqrt(x2/pi) H = x3 - Volume r = (x4*H)/(H + Volume) Power = (var1*x2)/(100*(pi*Volume/3)*(x4*x4 + x4*r + r*r)) Power <- jitter(Power, factor = 1, amount = 0.1) plot(Volume,Power) この図から、ある範囲の「ボリューム」と「パワー」の間の関係は線形であり、「ボリューム」が比較的小さくなると、関係は非線形になることが示唆されます。これを説明するための統計的検定はありますか？ OPへの応答に示されているいくつかの推奨事項に関して：ここに示されている例は単なる例であり、私が持っているデータセットは、ここで見られる関係に似ていますが、騒々しいです。これまでに行った分析では、特定の液体の体積を分析すると、体積が小さいと信号のパワーが大幅に増加することを示しています。つまり、ボリュームが15から20の間の環境しかなかったとしましょう。それは、ほぼ線形の関係のように見えます。ただし、ポイントの範囲を増やす、つまりボリュームを小さくすると、関係がまったく線形にならないことがわかります。これを統計的に示す方法に関する統計的なアドバイスを探しています。これが理にかなっているといいのですが。

9 r hypothesis-testing nonlinear-regression goodness-of-fit heteroscedasticity

4

多くの肯定的で重要でない結果がある場合、「これらの結果のうち少なくともが肯定的」であることをテストできますか？

100人の異なる個人に対して同じ回帰を別々に実行したとしましょう。私の関心のある係数は正です（そして互いにかなり異なります）が、100の結果すべてで統計的に重要ではありません（すべてのp値= 0.11としましょう）。これらのp値を組み合わせて、「これらの結果の少なくとも80が正である」とp = 0.11よりも有意性があると結論付ける方法はありますか？私のオンライン検索では、「これらの結果の少なくとも1つが陽性である」とフィッシャーまたは同様のテストで言う方法を示しただけですが、その結果を一般化することはできませんでした。「H0 = 100のすべての効果が0で同じである」に対して、「HA =少なくとも80の効果が陽性」に対してテストしたい。私の目標は、平均して正の係数があると言うことではなく、係数を具体的に測定することでもありません。私の目標は、少なくとも80人がそれぞれの80に関係なく、また各個人が感じる影響の大きさに関係なく、個々に何らかのプラスの影響に直面したことを、有意義に示すことです。

9 hypothesis-testing multiple-comparisons

3

フィッシャーの直接確率検定の検定統計量とは何ですか？

2×2分割表のために、一部が前記フィッシャーの正確確率検定をカウント使用検定統計量としてテーブルに（1,1）セルで、ヌル仮説の下で、X 1 、1は超幾何分布を有することになります。X1,1X1,1X_{1,1}X1,1X1,1X_{1,1} 一部の人は、そのテスト統計は次のとおりだと述べましたここで、μはnullでの超幾何分布（上記）の平均です。また、p値は超幾何分布の表に基づいて決定されるとも述べています。平均を差し引いて絶対値を取る理由があるのだろうか？| X 1 、1 - μ | nullの下に超幾何分布はありませんか？|X1,1−μ||X1,1−μ| |X_{1,1} - \mu| μμ\mu|X1,1−μ||X1,1−μ||X_{1,1} - \mu|

9 hypothesis-testing fishers-exact hypergeometric

2

不等分散の下でのマンホイットニー帰無仮説

マンホイットニーのU検定の帰無仮説に興味があります。私はしばしば、帰無仮説が2つの母集団の分布が等しいという仮説であると述べたのを見ます。しかし、私は考えています。平均が同じで分散が非常に異なる2つの正常な母集団がある場合、マンホイットニー検定はおそらくこの違いを検出しません。また、マンホイットニー検定の帰無仮説がまたは2番目の母集団からの観測（）を超える1つの母集団からの観測（）の確率（）（タイの除外）は0.5です。これはもう少し理にかなっているようですが、私が述べた最初の帰無仮説と同等ではないようです。Pr(X>Y)=0.5Pr(X>Y)=0.5\Pr(X>Y)=0.5XXXYYY 私はこれを解くのに少し助けが欲しいと思っています。ありがとう！

9 hypothesis-testing variance wilcoxon-mann-whitney

3

非正規データの同等性テスト？

必ずしも正規分布から得られたとは限らないデータがいくつかあります。グループ間の同等性の検定を実行したいと思います。通常のデータには、TOST（2つの片側t検定）のような手法があります。通常ではないデータのTOSTに類似したものはありますか？

9 hypothesis-testing equivalence tost

1

不明なp値の計算

私は最近Rスクリプトをデバッグしていて、非常に奇妙な何かを見つけました、著者は独自のp値関数を定義しました pval <- function(x, y){ if (x+y<20) { # x + y is small, requires R.basic p1<- nChooseK(x+y,x) * 2^-(x+y+1); p2<- nChooseK(x+y,y) * 2^-(x+y+1); pvalue = max(p1, p2) } else { # if x+y is large, use approximation log_p1 <- (x+y)*log(x+y) - x*log(x) - y*log(y) - (x+y+1)*log(2); pvalue<-exp(log_p1); } return(pvalue) …

9 r hypothesis-testing p-value

タグ付けされた質問 「hypothesis-testing」

タグ付けされた質問「hypothesis-testing」