1 F比ではなく分散の等性のレーベン検定を行う理由 SPSSは、Levene検定を使用して、独立グループt検定手順の分散の均一性を評価します。 2つのグループの分散比の単純なF比よりも、レーベン検定が優れているのはなぜですか? 21 hypothesis-testing anova variance t-test heteroscedasticity
3 NPS(ネットプロモータースコア)結果の誤差を計算するにはどうすればよいですか? ウィキペディアにNPSの計算方法を説明します。 ネットプロモータースコアは、0〜10の評価尺度で顧客に1つの質問をすることで得られます。10は「非常に可能性が高い」、0は「まったくそうではない」です。友達ですか?」回答に基づいて、顧客は3つのグループ(プロモーター(9〜10の評価)、受動的(7〜8の評価)、および中傷者(0〜6の評価)のいずれかに分類されます。次に、中傷者の割合をプロモーターの割合から差し引いて、ネットプロモータースコア(NPS)を取得します。NPSは、-100程度の低さ(全員が批判者)、または+100程度の高さ(全員がプロモーター)です。 この調査は数年間定期的に実施されています。毎回数百の応答があります。結果のスコアは、時間の経過とともに20〜30ポイント変化しました。私は、もしあれば、どのスコアの動きが重要かを見極めようとしています。 それが単純に難しすぎると判明した場合、計算の基本の誤差を把握することに興味があります。各「バケツ」(プロモーター、パッシブ、ディトラクター)の許容誤差はどのくらいですか?スコアの平均を見るだけで、データを調査の実行ごとに1つの数値に減らした場合、誤差の範囲はどのくらいでしょうか?それは私をどこにでも連れて行くでしょうか? ここでのアイデアは役に立ちます。「NPSを使用しないでください」を除きます。その決定は、私の変化する能力の範囲外です! 21 hypothesis-testing statistical-significance standard-error multinomial nps
5 高いp値を持つ強い相関係数の例 私は、非常に強い相関係数(たとえば.9以上)と高いp値(たとえば.25以上)を持つことは可能だろうかと思っていました。 これは、高いp値を持つ低い相関係数の例です。 set.seed(10) y <- rnorm(100) x <- rnorm(100)+.1*y cor.test(x,y) cor = 0.03908927、p = 0.6994 高い相関係数、低いp値: y <- rnorm(100) x <- rnorm(100)+2*y cor.test(x,y) cor = 0.8807809、p = 2.2e-16 低相関係数、低p値: y <- rnorm(100000) x <- rnorm(100000)+.1*y cor.test(x,y) cor = 0.1035018、p = 2.2e-16 高い相関係数、高いp値:??? 21 r hypothesis-testing correlation
4 分布がマルチモーダルかどうかをテストするにはどうすればよいですか? データのヒストグラムをプロットすると、2つのピークがあります。 それは潜在的なマルチモーダル分布を意味しますか?dip.testR(library(diptest))を実行しましたが、出力は次のとおりです。 D = 0.0275, p-value = 0.7913 私のデータにはマルチモーダル分布があると結論付けることができますか? データ 10346 13698 13894 19854 28066 26620 27066 16658 9221 13578 11483 10390 11126 13487 15851 16116 24102 30892 25081 14067 10433 15591 8639 10345 10639 15796 14507 21289 25444 26149 23612 19671 12447 13535 10667 11255 8442 11546 15958 21058 … 21 r hypothesis-testing distributions self-study histogram
2 サンプルサイズが小さいとタイプ1エラーが発生する可能性がありますか? サンプルサイズが小さいと電力が不足し、タイプ2エラーが発生する可能性があることを学びました。しかし、小さなサンプルは一般に信頼性が低く、偶然あらゆる結果につながる可能性があると感じています。本当? 21 hypothesis-testing small-sample
4 新しいベクターをPCA空間に投影する方法は? 主成分分析(PCA)を実行した後、新しいベクトルをPCA空間に投影します(つまり、PCA座標系で座標を見つけます)。 を使用してR言語でPCAを計算しましたprcomp。これで、ベクトルにPCA回転行列を掛けることができるはずです。このマトリックスの主成分を行または列に配置する必要がありますか? 21 r pca r variance heteroscedasticity misspecification distributions time-series data-visualization modeling histogram kolmogorov-smirnov negative-binomial likelihood-ratio econometrics panel-data categorical-data scales survey distributions pdf histogram correlation algorithms r gpu parallel-computing approximation mean median references sample-size normality-assumption central-limit-theorem rule-of-thumb confidence-interval estimation mixed-model psychometrics random-effects-model hypothesis-testing sample-size dataset large-data regression standard-deviation variance approximation hypothesis-testing variance central-limit-theorem kernel-trick kernel-smoothing error sampling hypothesis-testing normality-assumption philosophical confidence-interval modeling model-selection experiment-design hypothesis-testing statistical-significance power asymptotics information-retrieval anova multiple-comparisons ancova classification clustering factor-analysis psychometrics r sampling expectation-maximization markov-process r data-visualization correlation regression statistical-significance degrees-of-freedom experiment-design r regression curve-fitting change-point loess machine-learning classification self-study monte-carlo markov-process references mathematical-statistics data-visualization python cart boosting regression classification robust cart survey binomial psychometrics likert psychology asymptotics multinomial
2 FPR(偽陽性率)vs FDR(偽発見率) 次の引用は、Story&Tibshirani(2003)による有名な研究論文「ゲノム全体の研究の統計的有意性」から引用されています。 たとえば、偽陽性率が5%の場合、研究の真にヌルの特徴の平均5%が有意と呼ばれます。5%のFDR(False Discovery rate)は、重要と呼ばれるすべての機能の中で、これらの5%が平均して本当にヌルであることを意味します。 簡単な数値または視覚的な例を使用して、それが意味することを誰かが説明できますか?私はそれが何を意味するのか理解するのに苦労しています。FDRまたはFPRのみに関するさまざまな投稿を見つけましたが、特定の比較が行われた場所は見つかりませんでした。 この分野の専門家が、一方が他方より優れている、または両方が良いか悪いかの状況を説明できれば、特に良いでしょう。 20 hypothesis-testing false-discovery-rate type-i-and-ii-errors confusion-matrix false-positive-rate
4 多重比較が「計画」されている場合でも、多重比較を修正する必要がありますか? 15を超える個別の2x2カイ2乗検定を実行した論文をレビューしています。複数の比較を修正する必要があることを提案しましたが、すべての比較が計画されていると答えたため、これは必要ありません。 これは正しくないはずですが、そうであるかどうかを明示的に示すリソースは見つかりません。 誰でもこれを助けることができますか? 更新: 非常に有益な回答をありがとう。@gungの研究と分析に関する詳細情報のリクエストに応えて、3つの期間にわたって、2つの条件で2種類の参加者(学生、非学生)のカウントデータを比較しています。複数の2x2カイ2乗検定は、各条件で、各タイプの参加者ごとに各期間を比較するため(たとえば、学生、条件1、期間1対期間2)、すべての分析が同じ仮説をテストします。 。 20 hypothesis-testing multiple-comparisons
2 F統計がF分布に従うことの証明 この質問に照らして:OLSモデルの係数が(nk)自由度のt分布に従うことの証明 理由を理解したい F=(TSS−RSS)/(p−1)RSS/(n−p),F=(TSS−RSS)/(p−1)RSS/(n−p), F = \frac{(\text{TSS}-\text{RSS})/(p-1)}{\text{RSS}/(n-p)}, ここで、pppモデルパラメータの数であり、nnn観測の数及びTSSTSSTSS全分散、RSSRSSRSSの残留分散は、以下のFp−1,n−pFp−1,n−pF_{p-1,n-p}分布。 どこから始めればいいのかわからないので、私はそれを証明しようとさえしなかったことを認めなければなりません。 20 regression hypothesis-testing least-squares f-distribution f-statistic
2 強い整合性が必要な統計アプリケーションはありますか? 誰かが知っているのか、または弱い一貫性の代わりに推定量の強い一貫性が必要な統計のアプリケーションがあるのか疑問に思っていました。つまり、アプリケーションには強い整合性が不可欠であり、アプリケーションは弱い整合性では機能しません。 20 hypothesis-testing theory asymptotics estimators consistency
3 帰無仮説を棄却するには0.04993のp値で十分ですか? Wilcoxonの符号付きランクの統計的有意性検定で、値を生成するデータに。しきい値が場合、この結果は帰無仮説を棄却するのに十分ですか?または、p値を小数点以下3桁に丸めるとになるため、テストが決定的ではなかったと言っても安全ですか?0.04993 p < 0.05 0.050ppp0.049930.049930.04993p<0.05p<0.05p < 0.050.0500.0500.050 20 hypothesis-testing statistical-significance p-value
3 残差が正規分布していることを確認するために、どのテストを使用しますか? 残差対時間のグラフをほぼ正常にプロットすることから見えるいくつかのデータがありますが、確認したいです。エラー残差の正規性をテストするにはどうすればよいですか? 20 hypothesis-testing normal-distribution assumptions
3 スペクトル密度のピークの有意性のテスト スペクトル密度プロットを使用して、時系列の周期性を分析することがあります。通常、視覚的な検査によってプロットを分析し、周期性について結論を出そうとします。しかし、統計学者は、プロットのスパイクが統計的にホワイトノイズと異なるかどうかを確認するためのテストを開発しましたか?Rエキスパートは、スペクトル密度分析およびそのようなテストを行うためのパッケージを開発しましたか?誰かが助けることができれば素晴らしい。 よろしく、 P。 20 r time-series hypothesis-testing
10 帰無仮説はどれですか?科学理論、論理、統計の間の矛盾? 帰無仮説を設定する際の基礎となるロジックを理解するのが困難です。この回答では、明らかに一般に受け入れられている命題は、帰無仮説は効果がないという仮説であり、すべてが同じままである、つまり、太陽の下では何も新しいものではないというものです。 対立仮説は、あなたが証明しようとするものです。例えば、新薬はその約束を果たします。 今、科学理論と一般的な論理から、命題を偽造することしかできないことを知っています、私たちは何かを証明することはできません(すべての白鳥が白であることを証明できる白い白鳥はいませんが、黒い白鳥はそれを反証することができます)。これが、対立仮説を証明することと同等ではない帰無仮説を反証しようとする理由です-そして、これが私の懐疑論が始まるところです-私は簡単な例を挙げます: カーテンの後ろにどんな動物がいるかを知りたいとしましょう。残念ながら、私は動物を直接観察することはできませんが、この動物の足の数を調べるテストを行っています。今、私は次の論理的推論を持っています: 動物が犬の場合、4本の脚があります。 私がテストを実施し、4本の足があることがわかった場合、これが犬(馬、サイ、または他の4本足の動物である可能性がある)であるという証拠にはなりません。しかし、私はそれが持っていないことがわかった場合足が4本、これは犬になれないという明確な証拠です(健康な動物を想定)。 薬剤の有効性に変換カーテンの後ろの薬剤が有効かどうかを調べたい。私が得る唯一のものは、私に効果を与える数字です。効果が正の場合、何も証明されていません(4脚)。効果がない場合、私は薬の有効性を反証します。 これをすべて言って-私は思う-一般的な知恵に反して-唯一の有効な帰無仮説は 薬は効果的です(例:薬が効果的であれば効果が見られます)。 私が反証できるのはこれだけだからです。次のラウンドまで、より具体的になるように努めます。したがって、効果を述べるのは帰無仮説であり、対立仮説はデフォルトです(効果なし)。 統計的検定で逆になっているように見えるのはなぜですか? PS:上記の仮説を否定して有効な同等の仮説を得ることができないので、論理的に同等の形式は「効果が見られない場合、薬は有効ではない」ため、帰無仮説として「薬は有効ではありません」とは言えません結論はあなたが見つけたいものだからです。 PPS:これまでの答えを読んだ後の明確化のために:科学的理論を受け入れ、ステートメントを偽造することしかできず、それを証明できない場合、論理的に一貫している唯一のことは、新しい理論として帰無仮説を選択することです-偽造。現状を偽造した場合、手ぶらで放置されるためです(現状は反証されますが、新しい理論は証明されていません!)。そして、あなたがそれを偽造し損なうならば、あなたはどちらのより良い位置にでもありません。 20 hypothesis-testing philosophical
1 NYTimesでの統計的手法の誤用に関する記事 この記事を参照しています:http : //www.nytimes.com/2011/01/11/science/11esp.html 次の実験を検討してください。コインが頭に向かってわずかに重くなっていると信じる理由があると仮定します。テストでは、コインは1,000回のうち527回出てきます。 これは、コインが重み付けされているという重要な証拠ですか? 古典的な分析はイエスと言います。公正なコインでは、1,000回のフリップで527以上のヘッドを獲得する可能性は、従来のカットオフの20分の1、つまり5パーセント未満です。別の言い方をすれば、この実験では、「95%の信頼度で」重み付きコインの証拠を見つけます。 しかし、多くの統計学者はそれを購入しません。20分の1は、1,000スローで526を超える任意の数のヘッドを獲得する確率です。つまり、フリップする確率527、フリップする確率528、529などの合計です。 しかし、実験ではその範囲内のすべての数値が見つかりませんでした。このように、これらの専門家によると、コインに重みが付けられている場合、その数字を取得する確率を計算し、コインが同じ場合に同じ数字を取得する確率と比較する方が正確です。公正。 統計学者は、心理学者のジェフ・ルーダーとともに例を提供した統計学者のポール・スペックマンによると、この比率は約4対1より高くできないことを示すことができます。 最初の質問:これは私にとって新しいことです。誰かが正確な計算を見つけることができるリファレンスを持っていますか、および/またはあなた自身に正確な計算を与えることで私を助けることができますか、および/または同様の例を見つけることができるいくつかの資料を教えてくれますか? ベイズは、新しい証拠が登場すると、仮説の確率を更新する方法を考案しました。 そのため、特定の発見の強度を評価する際に、ベイジアン(BAYZ-ee-unと発音)分析では、既知の確率が組み込まれています(利用可能な場合)。 「うん、正しい」効果と呼ばれることもあります。キンカンが心臓病のリスクを90%低減すること、治療により1週間でアルコール中毒が治まること、敏感な親が男の子よりも女の子を産む可能性が2倍高いことが研究でわかった場合、ベイジアンの反応はネイティブの懐疑論者:ええ、そうです。この調査結果は、世界で観察可能なものと比較検討されます。 医学の少なくとも1つの分野-診断スクリーニングテスト-では、研究者は既知の確率を使用して新しい発見を評価しています。たとえば、新しい嘘発見テストの精度は90%で、10のうそつきのうち9のうそつきに正しくフラグを立てることができます。しかし、10人の嘘つきを含むことが既に知られている100人の人口に与えられた場合、テストはそれほど印象的ではありません。 10のうそつきのうち9を正しく識別し、1つを見逃します。しかし、他の90個のうち9個が嘘であると誤って識別されます。いわゆる真陽性(9)をテストでフラグが立てられた人の総数(18)で割ると、50%の正解率が得られます。「偽陽性」と「偽陰性」は、人口の既知の割合に依存します。 2番目の質問:新しい発見がこの方法で「本当」であるかどうかをどのように正確に判断しますか?そして:これは、事前に設定された事前確率を使用しているため、5%バリアのようにIs意的ではありませんか? 20 hypothesis-testing bayesian statistics-in-media