統計とビッグデータ hypothesis-testing

2

興味深い実験（残念ながらソースはありません）について、かなり尊敬される（人気のある）科学雑誌（ドイツのPM、2013年2月、36ページ）を読みました。直感的に結果の重要性を疑ったので、それが私の注意を引きましたが、提供された情報は統計的検定を再現するのに十分でした。研究者は、寒い気候で寒くなると風邪をひく確率が高くなるのではないかと考えました。そのため、180人の学生のグループをランダムに2つのグループに分割しました。1つのグループは、足を冷水に20分間保持しなければなりませんでした。もう一人は靴を履き続けた。ちょっとおかしな操作だと思いますが、一方で私は医者ではなく、医者はおもしろいと思います。倫理的な問題は別として。とにかく、5日後、治療グループの学生のうち13人は風邪をひいていましたが、靴を履いたグループでは5人しかいませんでした。したがって、この実験のオッズ比は2.87です。サンプルサイズがかなり小さいことを考えると、この違いが大きいのではないかと思い始めました。そこで、2つのテストを実施しました。最初に、正規近似を使用した比率の等価性の簡単なテスト。このテストは、で。私の推測では、これは研究者がテストしたものです。これは本当に重要なことです。ただし、このz検定は、通常の近似のために間違えない限り、大きなサンプルでのみ有効です。さらに、有病率はかなり小さく、これが効果の信頼区間のカバー率に影響を与えないのではないかと思います。z=1.988z=1.988z=1.988p=0.0468p=0.0468p=0.0468 2番目の試みは、モンテカルロシミュレーションと標準のピアソンカイ2乗の両方を使用したカイ2乗独立性検定でした。ここで、についての値を見つけます。p=.082p=.082p=.082 今では、結果についてそれほど安心しているわけではありません。このデータをテストするためのオプションが他にあるかどうか、2つのテストについてのあなたの考えは何か（特に、最初の重要なテストの仮定）

12 hypothesis-testing chi-squared experiment-design proportion biostatistics

4

3つ以上のサンプル間の中央値の差に関する仮説検定

質問 3つのグループの人のテストスコアは、Rの個別のベクトルとして保存されます。 set.seed(1) group1 <- rnorm(100, mean = 75, sd = 10) group2 <- rnorm(100, mean = 85, sd = 10) group3 <- rnorm(100, mean = 95, sd = 10) これらのグループの中央値に大きな違いがあるかどうかを知りたいです。ウィルコクソン検定を使用して、グループ1とグループ2をテストできることを知っています。 wilcox.test(group1, group2) ただし、これは一度に2つのグループのみを比較するため、3つすべてを同時に比較したいと思います。0.05の有意水準でp値が得られる統計的検定が必要です。誰か助けてくれますか？編集＃1-ムードの中央値検定ユーザーHibernatingの提案された答えに従って、Moodの中央値テストを試しました。 median.test <- function(x, y){ z <- c(x, y) g <- rep(1:2, c(length(x), length(y))) m …

12 r hypothesis-testing multiple-comparisons mean median

2

パラメトリックテストでnullが拒否されない場合、ノンパラメトリックテストでも同じことが行われますか？

ノンパラメトリックテストがそのパラメトリック代替よりもパワーが低いと想定される場合、これは、パラメトリックテストがヌルを拒否しない場合、そのノンパラメトリック代替もヌルを拒否しないことを意味しますか？パラメトリックテストの前提条件が満たされておらず、テストがとにかく使用されている場合、これはどのように変化しますか？

12 hypothesis-testing nonparametric parametric

1

隠れマルコフモデルで「最適な」モデルを選択するための基準

データの潜在状態の数を推定するために、隠れマルコフモデル（HMM）を近似しようとする時系列データセットがあります。これを行うための私の擬似コードは次のとおりです。 for( i in 2 : max_number_of_states ){ ... calculate HMM with i states ... optimal_number_of_states = "model with smallest BIC" ... } さて、通常の回帰モデルでは、BICは最もpar約的なモデルを好む傾向がありますが、HMMの場合、それが何をしているのかわかりません。BIC基準がどのようなHMMの傾向があるのかを実際に知っている人はいますか？また、AICと尤度値も取得できます。州の真の総数を推測しようとしているので、これらの基準の1つは、この目的のために他の基準よりも「優れている」のでしょうか。

12 r aic hidden-markov-model bic spss manova time-series r lme4-nlme regression modeling negative-binomial bayesian bugs state-space-models hypothesis-testing data-transformation factor-analysis sem

1

特定のコントラストのテスト：これは確かに難しい問題ですか？

私はこれをmathoverflowに投稿しましたが、誰も答えていません：統計的に有意なコントラストを識別するSchefféの方法は広く知られています。コントラスト手段の間では、、iは= 1 、... 、RのRの集団は、線形結合であるΣのR iは= 1、C I μ IここでΣ R I = 1、C iは = 0をμiμi\mu_ii=1,…,ri=1,…,ri=1,\ldots,rrrr∑ri=1ciμi∑i=1rciμi\sum_{i=1}^r c_i \mu_i∑ri=1ci=0∑i=1rci=0\sum_{i=1}^r c_i=0、コントラストのスカラー倍数は本質的に同じコントラストであるため、コントラストのセットは射影空間であると言えます。シェッフェの方法は言う帰無仮説をテストするすべてのこれらの間のコントラスト集団がある0を、そして有意水準の与えられたαを、確率で帰無仮説拒否α帰無仮説が真であることを考えると。帰無仮説が棄却された場合、Schefféは、彼のテストがどのコントラストが0と大きく異なるかを教えてくれると指摘します（私がリンクしているWikipediaの記事ではわかりません）。rrr000αα\alphaαα\alpha000 別の種類の状況で似たようなことができるかどうか知りたいです。単純な線形回帰モデルを検討し、どこがε I〜I 。私は。d 。N （0 、σ 2）、iが= 1 、... 、N。Yi=α+βxi+εiYi=α+βxi+εiY_i = \alpha + \beta x_i + \varepsilon_iεi∼i.i.d.N(0,σ2)εi∼i.i.d.⁡N(0,σ2)\varepsilon_i\sim\operatorname{i.i.d.}N(0,\sigma^2)i=1,…,ni=1,…,ni=1,\ldots,n 私が考えたい帰無仮説は、異なる種類のコントラストに関するものです。それは部分集合が存在しないと言うようにE （Y I）= α 1 + β X 私用I ∈ AおよびE （Y I）= …

12 regression hypothesis-testing contrasts np

2

ピアソンの相関検定のp値は、相関係数とサンプルサイズだけで計算できますか？

背景：著者は、著者がサンプルサイズ878からピアソン相関0.754を報告している1つの記事を読みました。相関テストの結果のp値は、「2つ星」有意です（つまり、p <0.01）。ただし、このような大きなサンプルサイズでは、対応するp値は0.001（3つ星が有意）未満である必要があると思います。このテストのp値は、ピアソン相関係数とサンプルサイズだけから計算できますか？はいの場合、これをRでどのように行うことができますか？

12 hypothesis-testing correlation p-value fraud

2

母平均から有意に離れた値の統計的検定：Z検定ですか、T検定ですか？

値は、値のリストと比較してどの程度重要ですか？ほとんどの場合、統計的テストには、サンプルセットと母集団の比較が含まれます。私の場合、サンプルは1つの値で作成され、母集団と比較します。私は、おそらく最も基本的な問題に直面している統計的仮説検定のディレッタントです。1つのテストではなく、数百のテストです。パラメータースペースがあり、すべてのポイントに対して有意差検定を実行する必要があります。パラメータの組み合わせごとに、値とバックグラウンドリスト（母集団）の両方が生成されます。次に、これをp値で並べて、興味深いパラメーターの組み合わせを見つけます。実際、このp-valが高い（有意でない）パラメーターの組み合わせを見つけることも重要です。それでは、1つのテストを行ってみましょう。選択したセットから生成された計算値と、ランダムなトレーニングセットを選択して計算された値のバックグラウンドセットがあります。計算値は0.35で、バックグラウンドセットは（おそらく？）平均0.25と非常に狭いstd（e-7）で正規分布しています。サンプルは他の何かから計算されているため、実際には分布についての知識はありません。それらはある分布からの乱数サンプルではないので、背景は正しい言葉です。帰無仮説は、「サンプルテストの平均が計算値0.35に等しい」というものです。これをいつZ検定またはT検定と見なすべきですか？母平均よりも値を大幅に高くしたいので、片側検定です。私はサンプルとして何を考慮するべきか少し混乱しています：1つのサンプル（観察）と母集団としてのバックグラウンドリストがあるか、私のサンプルがバックグラウンドリストであり、それを全体（非サンプリング）と比較しています帰無仮説によると同じ平均値を持つべき母集団。これが決定すると、テストは異なる方向に進むと思います。 T検定の場合、p値を計算するにはどうすればよいですか？R / Python / Excel関数を使用するのではなく、自分で計算したいと思います（その方法は既に知っています）。したがって、最初に正しい式を確立する必要があります。まず、私は私の場合にはT検定はサンプルサイズに連結される、フォームなければならないので、T検定は、少しも一般的であると思われる：ここでZ = ˉ XT=Z/s,T=Z/s,T=Z/s,とSであり、S=σ/σ集団STDに対して、サンプルSTD。したがって、2つのケースがあります。サンプルサイズが母集団のサイズであり、これがZ検定を処理していることを「推測」するか、母集団統計（nおよびstd）が不明ですが、分布は何らかの方法で近似し、私は本当にT検定を扱っています。いずれにせよ、私の次の質問は：Z=X¯σn√Z=X¯σnZ=\frac{\bar{X}}{\frac{\sigma}{\sqrt{n}}}s=σ^/σs=σ^/σs=\hat{\sigma}/\sigma p値を計算するにはどうすればよいですか？（つまり、R / Python / Excel関数またはp値テーブルのルックアップを使用せず、実際に数式に基づいて計算します。何をしているかを知りたいので）サンプルサイズに基づいて有意しきい値を決定するにはどうすればよいですか？（式がいいでしょう）

12 hypothesis-testing statistical-significance

2

適応シーケンシャル分析のp値の調整（カイ2乗検定の場合）？

私は、どの統計文献が次の問題に関連しているか、そしておそらくそれをどのように解決するかのアイデアを知りたいと思っています。次の問題を想像してください。一部の疾患には4つの治療法があります。どちらの治療がより良いかを確認するために、特別な試験を実施します。トライアルでは、被験者がいないことから始め、その後、1つずつ、より多くの被験者がトライアルに入力されます。各患者は、4つの可能な治療法のいずれかにランダムに割り当てられます。治療の最終結果は「健康」または「病気」であり、この結果をすぐに知ることができるとしましょう。つまり、任意の時点で、2 x 4の分割表を作成して、被験者の数がどの治療/最終結果に該当したかを示すことができます。 4つの可能な治療法の間に統計的に異なる治療法があるかどうかを確認するために、いつでも分割表を確認できます（たとえば、カイ2乗検定を使用）。それらのいずれかが他のすべてよりも優れている場合-トライアルを停止し、「勝者」として選択します。いくつかの試験が他の3つすべてよりも悪いことが示された場合、私たちは彼を試験から除外し、将来の患者への投与を停止します。ただし、ここでの問題は、特定のポイントでテストを実行できること、テスト間に相関関係があること、プロセスの適応性がプロセスを操作することのためにp値をどのように調整するかですたとえば、何らかの治療が「悪い」と判明した場合）？

12 hypothesis-testing chi-squared p-value multiple-comparisons sequential-analysis

1

ネストされていないモデルの等価性をテストする

yyyがxxxとダミー線形関数だとしましょうddd。私の仮説は、自体は他の変数のベクトル快楽主義的なインデックスのようなものだということです。dの（つまりz_1、z_2、...、z_n）でこれをサポートしています。これらの2つのモデルの等価性をテストする方法はありますか？dddZZZMANOVAMANOVAMANOVAZZZz1z1z_1z2z2z_2znznz_nddd モデル1：y=b0+b1⋅x+b2⋅d+e1y=b0+b1⋅x+b2⋅d+e1y = b_0 + b_1 \cdot x + b_2\cdot d + e_1 モデル2：y=g0+Z⋅G+e2y=g0+Z⋅G+e2y = g_0 + Z\cdot G + e_2 ここで、はパラメーターの列ベクトルです。GGG

12 r hypothesis-testing regression model-selection

5

2つの累積密度関数の比較

2つの累積密度関数の等価性をテストする方法を探しています。

12 distributions hypothesis-testing

3

重み付きフィッシャーの正確検定？

重みを考慮に入れたフィッシャーの正確検定のバリエーションを知っている人はいますか？例えば、サンプリングの重み。したがって、通常の2x2クロステーブルの代わりに、すべてのデータポイントには、ポイントを重み付けする「質量」または「サイズ」の値があります。サンプルデータ： A B weight N N 1 N N 3 Y N 1 Y N 2 N Y 6 N Y 7 Y Y 1 Y Y 2 Y Y 3 Y Y 4 フィッシャーの正確検定では、この2x2クロステーブルを使用します。 A\B N Y All N 2 2 4 Y 2 4 6 All …

12 hypothesis-testing

1

ドリフトのあるシリーズとトレンドのあるシリーズの違い

ドリフトのある系列は、としてモデル化できます。ここで、はドリフト（定数）、です。 yt= c + ϕ yt − 1+ εtyt=c+ϕyt−1+εty_t = c + \phi y_{t-1} + \varepsilon_tcccϕ = 1ϕ=1\phi=1 傾向のある系列は、としてモデル化できます。ここで、はドリフト（定数）、は確定的な時間傾向、です。yt= c + δt + ϕ yt − 1+ εtyt=c+δt+ϕyt−1+εty_t = c + \delta t + \phi y_{t-1} + \varepsilon_tcccδtδt\delta tϕ = 1ϕ=1\phi=1 どちらのシリーズもあり、どちらの動作も増加していると思います。私（1 ）I(1)I(1) 動作が増加する新しいシリーズがある場合、このシリーズがドリフトまたはトレンドのあるシリーズであることをどのようにして知ることができますか？私は2つの実行できるADFテストを： ADFテスト1：系列がドリフトのあるであるという帰無仮説私（1 ）I(1)I(1) ADFテスト2：Null仮説は、系列が傾向のあるである私（1 ）I(1)I(1) …

12 time-series hypothesis-testing stationarity trend unit-root

1

フィッシャーの厳密検定と超幾何分布

私はフィッシャーの正確なテストをよりよく理解したかったので、次のおもちゃの例を考案しました。ここで、fとmは男性と女性に対応し、nとyは次のように「ソーダ消費」に対応します。 > soda_gender f m n 0 5 y 5 0 明らかに、これは大幅な簡略化ですが、コンテキストが邪魔になりたくありませんでした。ここで私は男性がソーダを飲まず、女性がソーダを飲まないと仮定し、統計手順が同じ結論になるかどうかを確認したかっただけです。 Rでフィッシャーの正確検定を実行すると、次の結果が得られます。 > fisher.test(soda_gender) Fisher's Exact Test for Count Data data: soda_gender p-value = 0.007937 alternative hypothesis: true odds ratio is not equal to 1 95 percent confidence interval: 0.0000000 0.4353226 sample estimates: odds ratio 0 ここでは、p値が0.007937であるため、性別とソーダ消費が関連付けられていると結論付けます。フィッシャーの正確な検定が超幾何分布に関連していることを知っています。だから私はそれを使って同様の結果を得たいと思った。つまり、この問題は次のように表示できます。10個のボールがあり、5個が「男性」、5個が「女性」とラベル付けされており、交換せずに5つのボールをランダムに描画すると、0個の男性ボールが表示されます。。この観察の可能性は何ですか？この質問に答えるために、次のコマンドを使用しました。 …

12 fishers-exact hypergeometric clustering supervised-learning modeling econometrics r regression residuals heteroscedasticity independence distributions self-study matlab libsvm self-study conditional-probability conditional-expectation hypothesis-testing self-study multiple-comparisons mode statistical-significance chi-squared multiple-comparisons maximum-likelihood poisson-process optimization uncertainty genetic-algorithms bayesian model-selection overfitting maximum-likelihood optimization approximation r prediction model-evaluation r machine-learning survival neural-networks cox-model machine-learning bayesian bayesian-network hierarchical-bayesian pooling

4

ビッグデータを使用した仮説検定

ビッグデータを使用して仮説検定をどのように実行しますか？私の混乱を強調するために、次のMATLABスクリプトを作成しました。それが行うことは、2つのランダムな系列を生成し、1つの変数を他の変数に対して単純な線形回帰を実行することだけです。異なるランダム値を使用してこの回帰を数回実行し、平均を報告します。発生する傾向があるのは、サンプルサイズを大きくすると、平均してp値が非常に小さくなることです。検定の検出力はサンプルサイズと共に増加するため、十分な大きさのサンプルが与えられた場合、pデータは、仮説検定を拒否するのに十分なほど小さくなります。私は周りに尋ねました、そして、何人かの人々は「ビッグデータ」で効果サイズを見ることはより重要であると言いました、すなわち。テストが重要であり、かつ気になるほどの効果があるかどうか。これは、サンプルサイズが大きい場合、ここで説明するように、p値が非常に小さな差異を拾うためです。ただし、効果のサイズはデータのスケーリングによって決定できます。以下では、説明変数を十分に小さな大きさにスケーリングして、十分に大きなサンプルサイズを指定すると、従属変数に大きな影響を与えます。これらの問題が存在する場合、どのようにしてビッグデータから洞察を得ることができるのでしょうか。 %make average %decide from how many values to make average obs_inside_average = 100; %make average counter average_count = 1; for average_i = 1:obs_inside_average, %do regression loop %number of observations n = 1000; %first independent variable (constant term) x(1:10,1) = 1; %create dependent variable and the one …

12 hypothesis-testing large-data

1

検定vs検定？

私は検定と検定の違いを正確に理解しようとしています。tttzzz 私の知る限りでは、両方のクラスのテストに対して、同じテスト統計を使用します。 b^−Cseˆ(b^)b^−Cse^(b^)\frac{\hat{b} - C}{\widehat{\operatorname{se}}(\hat{b})} ここで、はサンプル統計、は参照（位置）定数（テストの詳細に依存）、およびは標準ですエラー。b^b^\hat{b}CCCseˆ(b^)se^(b^)\widehat{\operatorname{se}}(\hat{b})b^b^\hat{b} 次に、これら2つのクラスのテストの唯一の違いは、検定の場合、上記の検定統計量は分布に従う（一部のサンプルで決定された自由度の場合）のに対し、検定。同じ検定統計量は標準正規分布従います。（これは、またはの選択が、サンプルが十分に大きいかどうかによって左右されることを示唆しています。）ttttttdddzzzN(0,1)N(0,1)\mathcal{N}(0, 1)zzzttt これは正しいです？

12 hypothesis-testing t-test small-sample

タグ付けされた質問 「hypothesis-testing」

タグ付けされた質問「hypothesis-testing」