統計とビッグデータ hypothesis-testing

1

データ：この質問/コミュニケーションのために、データがrnbinom(1000,size=0.1,prob=0.01)Rのように見えると想定できます。これにより、負の二項分布から1,000観測のランダムサンプルが生成されます（size=0.1成功の確率ありprob=0.01）。これは、確率変数sizeが成功数の前の失敗数を表すパラメーター化です。尾は長く、1,000の観測値は多くのデータではありません。問題：データ（{1,2、....}の整数）[上記を参照]（1,500データポイント）が与えられ、「最適な」分布とパラメーターの推定値を見つけるように求められました。データについて他に何も知りません。これは長い尾を持つデータの非常に大きなサンプルではないことを知っています。データが増える可能性があります。私がやったこと： 2つの異なる分布をデータに当てはめて尤度比検定を使用することを検討しましたが、2つの分布がネストされていない限り、これは当てはまりません（適切な臨界p値を決定できないため） ... 次に、Kolmogorov-Smirnov検定（離散データ用に調整済み）の使用を検討しましたが、いずれにしても、Rで「tie with data」のp値を計算できないと不満がありました。このコンテキストでさまざまなディストリビューションの適合性をテスト/決定するための最善の方法は何ですか？ここに私が検討した他のいくつかがあります：（たくさんの）より多くのデータを求める。しかし、これは役に立ちますか？たとえば、漸近的な結果を使用できますか？ブートストラップ/リサンプリング/モンテカルロ方式を検討してください。もしそうなら、これを正しく行う方法を学ぶために私が読むことができる/読むべき標準リファレンスはありますか？ありがとう

9 hypothesis-testing goodness-of-fit

2

メタアナリシスでは、生データを含まない重要でない研究をどのように扱うべきですか？

特定の構成に関するグループAとグループBのパフォーマンスを調べて、メタ分析を行っているとしましょう。さて、私が出くわすいくつかの研究は、2つのグループ間で統計的な差が見つからなかったと報告しますが、正確なテスト統計や生データは表示されません。メタ分析では、そのような研究をどのように処理すればよいですか？基本的に、私はここに3つの異なる選択肢を見ます：それらすべてを含め、それぞれに0の効果サイズを割り当てます。それらをすべて捨てます。それらのそれぞれに対してある種の電力分析を行うか、特定の数の参加者にしきい値を設定します。統計的有意性に到達できたはずのすべてを含め、それぞれに効果サイズ0を割り当てます。残りは捨てます。すべての異なるオプションのメリットを確認できます。オプション1はかなり保守的であり、タイプIIのエラーを発生させるリスクしかありません。オプション2はタイプIのエラーを引き起こすリスクを高めますが、多くの不十分な研究のために結果が台無しになるのを防ぎます。オプション3は、オプション1とオプション2の間の中間のように見えますが、多くの仮定や純粋な推測を行う必要があります（パワー分析のベースとする効果のサイズはどれですか？それぞれに何人の参加者を要求する必要がありますか？合格するための研究？）、おそらく最終結果の信頼性を低下させ、主観性を高めます。

9 hypothesis-testing power-analysis meta-analysis effect-size group-differences

2

ヌル分布とサンプリング分布の違い

「null分布」と「サンプリング分布」の間の用語を明確にするために、この質問をします。ある人がnull分布と言ったとき、実際には他の人がサンプリング分布と言ったときと同じことを意味します。この仮説テストの記事[1]では、次の例の説明を見ることができます正規分布する確率変数Yを考えます。（これはモデルの仮定の1つです。）帰無仮説は次のとおりです。確率変数Yの母平均µは特定の値µ0です。簡単にするために、片側対立仮説について説明します。確率変数Yの母平均µはµ0より大きいです。（すなわち、µ> µ0）別のモデル仮定では、サンプルは単純なランダムサンプルであるとしています。サイズnの単純なランダムサンプルの形式のデータがあります。仮説検定の背後にある考えを理解するために、データのサンプルをしばらくの間保留し、確率変数Yから同じサイズnのすべての可能な単純なランダムサンプルを考慮する必要があります。そのようなサンプルの場合、そのサンプル平均ȳとそのサンプル標準偏差sを計算できます。次に、ȳとsを使用してt統計量t =（ȳ-µ0）/（s /√n）を計算します Yからサイズnのすべての可能な単純なランダムサンプルに対してこれを行うと、新しいランダム変数Tnが得られます。その分布は、サンプリング分布と呼ばれます。この推論手順（人口平均の片側t検定）に関連する数学的定理は、帰無仮説が真の場合、サンプリング分布はn自由度のt分布と呼ばれるものを持っていることを示しています。私は内容の理解に問題はありませんが、私の最大の関心事は「サンプリング分布」という用語についてです。ここでは、帰無仮説が真である場合、いわゆるサンプリング分布は検定統計量分布を指します。理論的な分布です。ウィキペディア[2]によれば、帰無仮説は同じことを意味するようです。統計に関する講義ノートをたくさん読みましたが、両方の用語が共存しています。しかし、標本分布を検索すると、さらに多くの結果が得られます。誰かが私の疑問を明確にできますか？null分布とサンプリング分布は同じ意味ですか？リファレンス：[1] http://www.ma.utexas.edu/users/mks/statmistakes/hyptest.html [2] http://en.wikipedia.org/wiki/Null_distribution

9 hypothesis-testing distributions sampling

1

STFT統計分析

Rパッケージのevolfft関数を使用してRSEIS、信号のSTFT分析を行っています。信号は1時間の長さで、3つの異なる条件、特に0-20 'コントロール、20'-40'刺激、40'-60 '刺激後に取得されました。視覚的には、これらの3つの期間中にスペクトログラムに変化が見られます。治療中に周波数が高くなり、FFTパワーが増加しますが、「いくつかの数値を付ける」ために実行できる統計分析の種類があるかどうか疑問に思っていました。なにか提案を？編集：提案されたように、私が扱っているデータの例を追加しますかなり広い周波数範囲でFFTのパワーが増加することがわかるように、処理は20 '〜40'の間です。実験ごとにこれらのSTFTが50〜60あります（合計10実験）。各実験のスペクトルを平均化しても、同様のタイプのパターンが得られます。さて、私の問題は、私が持っているデータをどのように正確に定量化し、治療前、治療中、治療後に比較する統計を作成するかです。

9 time-series hypothesis-testing anova fourier-transform

7

コインが900回投げられて490回表が出たかどうかを評価する方法は？

コインは900回投げられ、表が490回現れました。結果は、コインが公平であるという仮説を裏付けていますか？

9 hypothesis-testing self-study statistical-significance binomial

3

ベイジアンABテスト

1か月あたりのアクセス数が5,000回しかないページでABテストを実行しています。テストとコントロール間の+ -1％の差を測定するために必要なトラフィックレベルに到達するには、時間がかかりすぎます。ベイジアン統計を使用して、テストの成績が良かったかどうかを判断できる可能性があると聞きました。ベイジアン統計を使用して現在のデータを分析するにはどうすればよいですか？ Visitors Conversions Control 1345 1165 Test A 961 298 Test B 1274 438

9 bayesian hypothesis-testing ab-test

2

実際のケースで、テストの前提をテストせずに、どのように検証するか

テストの結果に基づいて使用するテストを選択した場合、結果の複合テストには未知のプロパティ（タイプIおよびIIのエラー率）があるため、正式にはテストの仮定をテストすることはできません。これが、統計への「シックスシグマ」のようなアプローチ（テスト結果に基づく決定木を使用して、使用するテストを選択する）がプロの統計学者の間で悪いラップを得る理由の1つだと思います。ただし、実際のデータでは、多くの場合、古典的な仮定が適用されない可能性があるサンプルを取得するため、何らかの方法で確認する必要があります。では、実際に仕事や研究で何をしているのですか？非公式チェックを実行します。たとえば、データの分布を見て、tを使用します-経験的分布が歪んでいないように見えるときのテスト？これは私がほとんどの場合行われていると思うものです。ただし、この「非公式テスト」の結果に基づいて決定を行う限り、テストのプロパティに影響を与えます。もちろん、チェックを使用して決定を行わない場合、チェックは役に立たないため、貴重な時間を無駄にしてはいけません。もちろん、正式なテストプロパティは過大評価されており、実際にはそれを信仰する必要はないと私に答えることができます。これが、理論的な背景だけでなく、実際にあなたが何をしているかに興味がある理由です。別のアプローチは、より少ない仮定で常にテストを使用することです。通常、私が好むよう額装されたこのアプローチを見てきたノンパラメトリック上でテストをパラメトリック以下の前提条件（前者は検定統計量は、パラメータのベクトルでインデックスさ分布の家族から来て、これより堅牢であることを前提としないので、テスト）。これは一般的に正しいですか？このアプローチでは、場合によっては、パワー不足のテストを使用するリスクがありませんか？よく分かりません。適用される統計の有用な（おそらく単純な）参照はありますか？これは、使用するテスト/モデルのリストを、古典的なテスト（t検定、カイ2乗など）のより良い代替として、いつ使用するかを示していますか？

9 hypothesis-testing nonparametric assumptions

1

plmを使用して推定された、入れ子になったエラーコンポーネントを含む、反復測定FEモデルのグループの比較

plmを使用して、グループ化変数、つまり非ネストモデルに基づいて、ネストされたエラーコンポーネントを含むいくつかの反復測定Fixed Effectsモデルを推定しました。今興味がある完全なモデルが有意に異なる場合、テストは、すなわち満杯のためのモデルであるとの完全なモデルであり、そして β FのEのM A L E β M のL EHo：βFe m a l e= βMリットルのEHo：βFeメートルale=βMaleH_o: \beta_{Female} = \beta_{Male}βFe m a l eβFeメートルale\beta_{Female}FemalesβMリットルのEβMale\beta_{Male}Males 続いて、2つのグループ間で選択した回帰係数をテストします。つまり、ここで、はの回帰係数ですat 、およびはatの男性の回帰係数です。Ho：βFe m a l e = = ye a r 1.5= βMa l e = = ye a r 1.5Ho：βFeメートルale==year1.5=βMale==year1.5H_o: \beta_{Female == year1.5} = \beta_{Male …

8 r hypothesis-testing repeated-measures nested-data plm

1

複数の回帰係数が統計的に異ならないかどうかをテストする方法は？

私は、次の多変量線形回帰推定言うどのようにテストすることができ、そのβ 1 = β 2 = β 3？y= β0+ β1バツ1+ β2バツ2+ β３バツ３+ β4バツ4+ ϵy=β0+β1x1+β2x2+β3x3+β4x4+ϵ y = \beta_0 +\beta_1 x_1 +\beta_2 x_2+\beta_3x_3+\beta_4x_4 + \epsilonβ1= β2= β３β1=β2=β3\beta_1=\beta_2=\beta_3 かどうかをテストするには、てテストを作成するだけでことを知っていますβ1= β2β1=β2\beta_1=\beta_2ZZZZ= β1- β2s e2β1+ s e2β2−−−−−−−−−√Z=β1−β2seβ12+seβ22 Z = \frac{\beta_1-\beta_2}{\sqrt{se_{\beta_1}^2+se_{\beta_2}^2}} 複数の係数推定値の類似物はありますか？

8 regression hypothesis-testing multiple-regression

2

一貫性のない正規性テスト：Kolmogorov-Smirnov対Shapiro-Wilk

現在、私が書いたMCシミュレーションによって生成されたデータを調べています。値が正規分布していると思います。当然、私はヒストグラムをプロットし、それは妥当に見えます（私は推測しますか？）： [左上：ヒストグラムdist.pdf()、右上：累積ヒストグラムdist.cdf()、下：QQプロット、data対dist] 次に、いくつかの統計的検定を使用してこれをさらに詳しく調べることにしました。（注意してくださいdist = stats.norm(loc=np.mean(data), scale=np.std(data))。）私がしたことと私が得た出力は次のとおりです：コルモゴロフ-スミルノフ検定： scipy.stats.kstest(data, 'norm', args=(data_avg, data_sig)) KstestResult(statistic=0.050096921447209564, pvalue=0.20206939857573536) Shapiro-Wilkテスト： scipy.stats.shapiro(dat) (0.9810476899147034, 1.3054057490080595e-05) # where the first value is the test statistic and the second one is the p-value. QQプロット： stats.probplot(dat, dist=dist) これからの私の結論は：ヒストグラムと累積ヒストグラムを見ることで、私は間違いなく正規分布を仮定します QQプロットを見た後も同じことが言えます（これまでにずっと良くなっていますか？） KSテストは言う：「はい、これは正規分布です」私の混乱は次のとおりです。SW検定では、正規分布ではないことが示されています（p値は有意性よりはるかに小さくalpha=0.05、初期の仮説は正規分布でした）。これは理解できません。誰かより良い解釈がありますか？ある時点で失敗しましたか？

8 hypothesis-testing normal-distribution python kolmogorov-smirnov

3

仮説検定のType-IIエラーがエラーと見なされるのはなぜですか？

仮説検定の決定エラーについて読んでいます。私の質問は、「タイプIIエラー」がなぜエラーと見なされるのかということです。私が理解していることから、それは私たちが偽の帰無仮説を拒否することに失敗したときに発生します。帰無仮説を棄却できない場合、それは単にそれを棄却する強力な証拠がないことを意味します。2つの仮説のどちらが真（または偽）であるかについてはコメントしていません。どちらも真である可能性があります。帰無仮説が正しいと言っているのではありません。したがって、そのような結論がエラーと呼ばれるのはなぜですか？

8 hypothesis-testing statistical-significance p-value

1

パラメトリックおよびノンパラメトリックテストの解釈

パラメトリックテストと非パラメトリックテストの違いに関する質問を検索しましたが、質問はすべて非常に特定のテスト、データの問題、またはいくつかの技術的な違いに焦点が当てられているようです。テストの仮定の問題（代わりに調べないでください）や、電力やエラー率の問題には興味がありません。私の質問は、2種類のテストの解釈についてです。パラメトリックと非パラメトリックのテスト結果の解釈に違いはありますか？ノンパラメトリックテストを実行している場合は、不明な母集団の議論への道を弱めている（排除している）ため、おそらくテスト結果を議論する方法がより制限されているようです。パラメトリックテストを実行する場合、母集団への接続は仮定に基づいて行われます。各テストの適切な解釈は何ですか？これらの区別は重要ですか？

8 hypothesis-testing nonparametric interpretation parametric

2

タイプIのエラー率は、アルファまたは最大でアルファですか？

ウィキペディアのp値のページによると： p値が正しく計算されると、このテストにより、タイプIのエラー率が最大でことが保証されます。αα\alpha ただし、ページのさらに下には、この式が示されています。 Pr(RejectH|H)=Pr(p≤α|H)=αPr(RejectH|H)=Pr(p≤α|H)=α\Pr(\mathrm{Reject}\; H|H) = \Pr(p \leq \alpha|H) = \alpha 「タイプ1エラーレート」= Pr(RejectH|H)Pr(RejectH|H)\Pr(\mathrm{Reject}\; H|H)すると、タイプ1エラーレートはαα\alphaあり、「多くてもαα\alpha」ではないことがわかります。そうでない場合、式は次のようになります。 Pr(RejectH|H)≤αPr(RejectH|H)≤α\Pr(\mathrm{Reject}\; H|H) \leq \alpha 私の誤解はどこにありますか？

8 hypothesis-testing p-value type-i-and-ii-errors

1

Wald検定に使用する分散推定はどれですか？

帰無仮説 Wald検定について、スカラーパラメーターに対して正当化をました。場合ためのMLEであるサイズの独立サンプルから推定、帰無仮説の下で私たちがとしての分布。ここで、はで評価された単一の観測の予想情報です。テスト統計を使用する必要があるように私には思えます θ θ N、θ N √H0:θ=θ0H0:θ=θ0H_0: \theta = \theta_0θθ\thetaθ^nθ^n\hat{\theta}_nθθ\thetannnのn→∞I（θ0）θ0n−−√(θ^n−θ0)→N(0,1i(θ0))n(θ^n−θ0)→N(0,1i(θ0))\sqrt{n}\left(\hat{\theta}_n - \theta_0\right) \rightarrow N\left(0, \dfrac{1}{i(\theta_0)}\right)n→∞n→∞n\rightarrow \inftyi(θ0)i(θ0)i(\theta_0)θ0θ0\theta_0 n−−√(θ^n−θ0)1i(θ0)−−−−−√n(θ^n−θ0)1i(θ0) \dfrac{\sqrt{n}\left(\hat{\theta}_n - \theta_0\right)}{\sqrt{\dfrac{1}{i(\theta_0)}}} 大きな、これはおよそになります。ただし、Wald統計を次のように記述する方が一般的です。n個N(0,1)N(0,1)N(0,1)nnn n−−√(θ^n−θ0)1i(θ^)−−−−−⎷,n(θ^n−θ0)1i(θ^), \dfrac{\sqrt{n}\left(\hat{\theta}_n - \theta_0\right)}{\sqrt{\dfrac{1}{i\left(\hat{\theta}\right)}}}, つまり、期待される情報をではなくでます。私の質問は、仮説検定を実行するためにnullでの検定統計量の分布が必要であることを考えると、nullでの標準誤差を推定して推定すること、つまり by？ θ0秒。e。（ θ）√θ^θ^\hat{\theta}θ0θ0\theta_0s.e.(θ^)s.e.(θ^)s.e.\left(\hat{\theta}\right)1i(θ0)−−−−−√1i(θ0)\sqrt{\dfrac{1}{i\left(\theta_0 \right)}}

8 hypothesis-testing maximum-likelihood

1

マルコフ連鎖が理論的な連鎖と等しいかどうかをテストする

経験的な遷移カウント行列Qがあります。理論的な1次のマルコフ連鎖Pがあります。Nは遷移の数です。QがPと互換性があるかどうかをテストしたいと思います。カイ二乗統計計算する理論的なカウント遷移行列（N * P）、次に自由度の分布のp値を計算します？ χ2K*（K-1）∑Ki,j(Qij−(N∗Pij))2N∗Pij∑i,jK(Qij−(N∗Pij))2N∗Pij\sum_{i,j}^{K} \frac{(Q_{ij}-(N*P_{ij}))^2}{N*P_{ij}}χ2χ2\chi^2K∗(K−1)K∗(K−1)K*(K-1)

8 hypothesis-testing chi-squared markov-process

タグ付けされた質問 「hypothesis-testing」

タグ付けされた質問「hypothesis-testing」