タグ付けされた質問 「p-value」

頻度主義仮説検定では、 p-valueは、帰無仮説が真であるという仮定の下で、観測された結果よりも極端な(またはそれ以上の)結果の確率です。

2
Palantirのアジア差別事件:確率はどのように計算されましたか?
労働省がアジア人に対する差別で彼らを非難しているパランティールの事例について、私はこの記事を読みました。誰がどこからこれらの確率推定値を取得したか知っていますか? 項目(a)で1/741が得られません。 (a)QAエンジニアポジションでは、730人以上の適格な応募者のプール(約77%がアジア人)から、Palantirは6人の非アジア人応募者と1人のアジア人応募者のみを採用しました。OFCCPによって計算された悪影響は、3つの標準偏差を超えています。この結果が偶然に発生した可能性は、741分の1です。 (b)ソフトウェアエンジニアの立場では、1,160人を超える適格な応募者(約85%がアジア人)のプールから、Palantirはアジア以外の応募者14人とアジアの応募者11人のみを採用しました。OFCCPによって計算された悪影響は、5標準偏差を超えています。この結果が偶然に発生した可能性は、340万分の1です。 (c)QAエンジニアのインターンポジションでは、130人を超える適格な応募者のプール(約73%がアジア人)から、Palantirは17人のアジア人以外の応募者と4人のアジア人応募者を採用しました。OFCCPによって計算された悪影響は、6標準偏差を超えています。この結果が偶然に発生した可能性は、およそ10億分の1です。

3
p = 5.0%は有意ですか?
今日、p値0.05(正確に)が有意である(アルファ= 5%である)と見なされるかどうかを尋ねられました。私は答えを知りませんでしたが、Googleは両方の答えを出しました。(a)pが5%未満の場合、結果は重要です。(b)pが5%未満または5%の場合、結果は有意です。 もちろん、これらのウェブサイトは誰も引用していません。なぜそうすべきなのか-それは常識であり、5%はとにかくarbitrary意的です。しかし、それは生徒に覚えておくべきことを伝えるのに役立ちません。 それで、ここに仮説のテストに関する私の必死の質問があります:p値が正確にアルファである場合-結果を有意とみなすかどうか?この場合の正式な引用とは何ですか? どうもありがとうございました

5
AICを使用してモデル選択を適用すると、変数の有意でないp値が得られる理由
AICについて質問がありますので、ご協力ください。データのAICに基づいて、モデルの選択(逆方向または順方向)を適用しました。また、選択した変数の一部は、p値が0.05を超えました。私は人々がp値の代わりにAICに基づいてモデルを選択すべきだと言っていることを知っているので、AICとp値は2つの異なる概念であるようです。誰かが違いを教えてもらえますか?私がこれまでのところ理解しているのは、それです: AICを使用した後方選択の場合、3つの変数(var1、var2、var3)があり、このモデルのAICはAIC *であるとします。これらの3つの変数のいずれか1つを除外しても、AIC *(df = 1のch-square分布に関して)より大幅に低いAICにならない場合、これら3つの変数が最終結果であると言えます。 3変数モデルの変数(var1など)の重要なp値は、その変数の標準化された効果サイズが0(Waldまたはt検定による)とは大きく異なることを意味します。 これら2つの方法の基本的な違いは何ですか?最良のモデル(AICで取得)に有意でないp値を持つ変数がある場合、どのように解釈すればよいですか?

2
任意の分布からp値を計算する
これがばかげた質問ではないことを願っています。任意の連続分布があるとしましょう。統計もあり、この任意の分布を使用して、この統計のp値を取得したいと思います。 Rでは、正規分布のように、分布が組み込み分布の1つに適合する限り、これを行うのは簡単です。しかし、そのような仮定をすることなく、任意の分布でこれを行う簡単な方法はありますか?

2
Benjamini-Hochbergで調整されたp値の式は何ですか?
手順とそれが制御するものを理解しています。それでは、多重比較のためのBH手順の調整されたp値の式は何ですか? たった今、オリジナルのBHが調整されたp値を生成せず、(非)拒否条件のみを調整したことに気付きました:https : //www.jstor.org/stable/2346101。Gordon Smythは、とにかく2002年に調整されたBH p値を導入したので、問題は依然として当てはまります。p.adjustmethodと同様にRで実装されていBHます。

3
途方もなく大きなZスコアに関連する確率を計算する方法は?
ネットワークモチーフ検出用のソフトウェアパッケージは、非常に高いZスコアを返すことがあります(私が見た最高は600,000+ですが、100を超えるZスコアは非常に一般的です)。これらのZスコアが偽であることを示すつもりです。 巨大なZスコアは、非常に低い関連確率に対応します。関連する確率の値は、最大6のZスコアの正規分布ウィキペディアページ(およびおそらくすべての統計テキスト)に記載されています。 質問:誤差関数1−erf(n/2–√)1−erf(n/2)1-\mathrm{erf}(n/\sqrt{2})nで最大1,000,000の場合、たとえば? 私は特に、このために既に実装されたパッケージを望んでいます(可能な場合)。私がこれまでに見つけた中で最高のものはWolframAlphaで、n = 150で計算できます(こちら)。

7
結果を「ほぼ」または「ある程度」重要と呼ぶのは間違っていますか?
同様の質問に対する一般的なコンセンサス、結果を「非常に重要」と呼ぶのは間違っていますか?「非常に重要」は、事前に設定された重要度のしきい値をはるかに下回るp値を持つ関連付けの強度を記述するための有効な方法ですが、非特異的ではあります。ただし、しきい値をわずかに上回る p値の記述についてはどうでしょうか。私は、「ある程度重要」、「ほぼ重要」、「重要に近づく」などの用語を使用する論文を見てきました。私はこれらの用語が少し希望的でウォッシュなものであり、場合によっては否定的な結果の研究から意味のある結果を引き出す境界線の不誠実な方法だと思います。これらの用語は、p値のカットオフを「見逃す」結果を説明するのに受け入れられますか?

1
Bayesian glmの値の理解を手伝ってください
ここでデータに対してベイジアンロジットを実行しようとしています。Rのパッケージで使用bayesglm()していarmます。コーディングは簡単です。 df = read.csv("http://dl.dropbox.com/u/1791181/bayesglm.csv", header=T) library(arm) model = bayesglm(PASS ~ SEX + HIGH, family=binomial(link="logit"), data=df) summary(model) 次の出力が得られます。 Coefficients: Estimate Std. Error z value Pr(>|z|) (Intercept) 0.10381 0.10240 1.014 0.311 SEXMale 0.02408 0.09363 0.257 0.797 HIGH -0.27503 0.03562 -7.721 1.15e-14 *** --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 …
13 r  bayesian  p-value 

1
Rのwilcox.testとcoin :: wilcox_testの違いは何ですか?
これらの2つの関数はRに存在しますが、それらの違いはわかりません。で呼び出すwilcox.testと、同じp値のみを返すようですcorrect=FALSE、とwilcox_testとの(コインパッケージ内)distribution="aymptotic"。他の値の場合、異なるp値を返します。またwilcox.test、パラメータの設定とは関係なく、データセットに対して常にW = 0を返します。 x = c(1, 1, 1, 3, 3, 3, 3) そして y = c(4, 4, 6, 7, 7, 8, 10) また、R以外のさまざまなツール(オンラインで利用できるもの、Excelアドオンとして利用できるもの)を使用しようとすると、異なるp値が報告されることがあります。 それで、どのツールが「正しい」p値を与えているかをどうやって知ることができますか? 「正しい」p値はありますか、またはいくつかのツールがp値を0.05未満にする場合、私は幸せでしょうか?(これらのツールはRのようなパラメーター化の可能性をあまり提供しない場合があります。) ここで何が欠けていますか?

3
単純な線形回帰、p値、およびAIC
このトピックは、例えばhereの前に何度も出てきましたが、回帰出力をどのように解釈するのが最善かはまだわかりません。 x値の列とy値の列で構成される非常に単純なデータセットがあり、場所(loc)に従って2つのグループに分割されています。ポイントはこんな感じ 同僚は、各グループに個別の単純な線形回帰を当てはめる必要があると仮定しましたy ~ x * C(loc)。出力を以下に示します。 OLS Regression Results ============================================================================== Dep. Variable: y R-squared: 0.873 Model: OLS Adj. R-squared: 0.866 Method: Least Squares F-statistic: 139.2 Date: Mon, 13 Jun 2016 Prob (F-statistic): 3.05e-27 Time: 14:18:50 Log-Likelihood: -27.981 No. Observations: 65 AIC: 63.96 Df Residuals: 61 BIC: 72.66 Df Model: …

3
仮説検定で尖度の高い尖度が問題になるのはなぜですか?
残差の高正尖度は、正確な仮説検定と信頼区間(したがって統計的推論の問題)にとって問題になる可能性があると聞きました(テキストへのリンクを提供することはできません)。これは本当ですか、もしそうなら、なぜですか?残差の高い正の尖度は、残差の大部分が残差平均0に近いことを示していないので、残差が少ないことがわかりますか (答えがある場合は、数学的にあまり傾いていないので、あまり詳しくない数学で答えてみてください)。

1
Rでのロジスティック回帰出力の解釈
私はを使用してRの多重ロジスティック回帰に取り組んでいますglm。予測変数は連続的でカテゴリカルです。モデルの要約の抜粋は次を示しています。 Coefficients: Estimate Std. Error z value Pr(>|z|) (Intercept) 2.451e+00 2.439e+00 1.005 0.3150 Age 5.747e-02 3.466e-02 1.658 0.0973 . BMI -7.750e-02 7.090e-02 -1.093 0.2743 ... --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 信頼区間: 2.5 % 97.5 % (Intercept) 0.10969506 1.863217e+03 Age 0.99565783 …

3
異なるサンプルサイズでのp値の相対サイズ
異なるサンプルサイズで、p値の相対サイズはどのように変化しますか?あなたが得た場合のようにで、相関のために、その後に元のp値と比較して、第二の試験のためのp値の相対的な大きさであるもの、0.20の同一のp値を得場合?p=0.20p=0.20p=0.20n=45n=45n=45n=120n=120n=120n=45n=45n=45

8
p値が正確に1(1.0000000)である場合、帰無仮説が真であることをサポートするために、信頼区間の制限はどうなりますか?[閉まっている]
閉じた。この質問には詳細または明確さが必要です。現在、回答を受け付けていません。 この質問を改善したいですか?詳細を追加し、この投稿を編集して問題を明確にします。 5か月前に閉鎖されました。 これは純粋に仮説的な質問です。非常に一般的なステートメントは、は決して真ではなく、サンプルサイズの問題であるということです。H0H0H_0 実際には、正規分布母集団(および推定両方)から 2つの平均()の間に測定可能な差はまったくないと仮定します。グループごとにと仮定し、テストを使用します。これは、値がことを意味し、の矛盾がないことをます。これは、検定統計量があることを示します。グループ間の平均差はなり。この場合の平均差の信頼区間の限界は何ですか?彼らでしょうかμ1=μ2μ1=μ2\mu_1=\mu_2μ=0μ=0\mu=0σσ\sigma=1=1=1N=16N=16N=16tttppp1.000001.000001.00000H0H0H_000000095%95%95\%[0.0,0.0][0.0,0.0][0.0, 0.0]? 私の質問の主なポイントは、ときに我々は本当に言うことができるということでしたH0H0H_0真である、すなわちμ1=μ2μ1=μ2\mu_1=\mu_2、この場合には?または、頻繁なフレームワークでは、2つの平均を比較するときに「差なし」と本当に言えるのでしょうか。

2
選択した偽陽性/偽陰性のエラー率と基礎となるコスト比を厳密に正当化する方法は?
環境 社会科学者と統計学者のグループ(Benjamin et al。、2017)は、最近、「統計的有意性」を決定するためのしきい値として使用される典型的な偽陽性率( = .05)をより保守的なしきい値(α = .005)。競合する社会科学者と統計学者のグループ(Lakens et al。、2018)が回答し、これまたはその他の任意の閾値の使用に反対しました。以下は、レーケンズらからの引用です。(p。16)それは私の質問の主題を例示するのに役立ちます:αα\alphaαα\alpha 理想的には、アルファレベルは、決定理論を使用して効用関数に対してコストと利点を比較することによって決定されます。この費用便益分析(およびアルファレベル)は、入手が困難なサンプルからデータを収集する場合と比較して、大きな既存のデータセットを分析する場合に異なります。科学は多様であり、使用することを決定したアルファレベルを正当化するのは科学者次第です。...研究は、ヒューリスティックおよび任意の包括的しきい値ではなく、厳密な科学の原則に基づいて行う必要があります。 質問 Lakens et al。のように、選択されたアルファを「厳密な科学の原則に導かれる」方法で正当化する方法を考えているのです。ほとんどの社会科学の文脈(つまり、最適化するために利益などのより具体的な品質がある特定のケース以外)で提案しますか? Lakensらの普及に続いて、私は研究者がこの決定を下すのを助けるためにオンライン計算機が循環しているのを見始めました。それらを使用する場合、研究者は偽陽性と偽陰性のエラーの「コスト比」を指定する必要があります。ただし、この計算機が示唆しているように、このようなコスト比率の決定には、多くの定量的な推測作業が含まれます。 いくつかのエラーコストは金銭的に簡単に定量化できます(直接コスト)が、他のエラーコストを1ドル(間接コスト)にすることは困難です。...定量化するのは困難ですが、それらに数字を付ける努力をする必要があります。 たとえば、レイケンズなど。アルファを正当化する際に考慮する可能性のある要因として到達困難なサンプルを検討することを提案しますが、そのサンプルがどれだけ到達困難であるかを推測し、それによってアルファの選択をそれに応じて調整する方法を推測しているようです。別の例として、誤った推論を前提とする研究の追求に他の人が後でどれだけの時間/お金を費やすかという観点から、偽陽性の公開のコストを定量化することは私には難しいように思われます。 このコスト比の決定が主に主観的な最善の推測の問題である場合、これらの決定が(再び、利益のようなものの最適化以外で)「正当化」できるかどうか疑問に思っています。つまり、サンプリング、トレードオフ、影響などについて行われた仮定の外に存在する方法で?このように、偽陽性/偽陰性エラーのコスト比を決定することは、ベイジアン推論で事前分布を選択することに似ているように思われます。 -合理的な比較かどうかはわかりませんが。 概要 私の質問を具体的にするには: 偽陽性/偽陰性率とそのコスト比は、ほとんどの社会科学の文脈で「厳密に」正当化されることはありますか? もしそうなら、これらの分析の選択を正当化するために従うことができる一般化可能な原則は何ですか(そしておそらくそれらのうちの1つまたは2つの例) そうでない場合、コスト比を選択する際の潜在的な主観性(ベイジアンの事前選択に似ている)の私の類推は合理的なものですか? 参照資料 Benjamin、DJ、Berger、J.、Johannesson、M.、Nosek、BA、Wagenmakers、E。、... Johnson、V.(2017年7月22日)。統計的有意性を再定義します。psyarxiv.com/mky9jから取得 Lakens、D.、Adolfi、FG、Albers、CJ、Anvari、F.、Apps、MA、... Zwaan、RA(2018、January 15)。あなたのアルファを正当化します。psyarxiv.com/9s3y6から取得

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.