タグ付けされた質問 「f-test」

2
循環データを使用して分散の等価性をテストする方法
8つの異なるサンプル(それぞれ異なる母集団から)内の変動の量を比較することに興味があります。これは、比率データを使用したいくつかの方法で実行できることを知っています:F検定の分散の等価性、リーベン検定など。 ただし、私のデータは円形/方向(つまり、風向や一般的な角度データ、または時刻などの周期性を示すデータ)です。私はいくつかの研究を行った結果、Rの「CircStats」パッケージに「Watson's test for homogeneity」という1つのテストが見つかりました。1つの欠点は、このテストでは2つのサンプルのみを比較することです。つまり、8つのサンプルで複数の比較を行う必要があります(その後、Bonferonni補正を使用します)。 私の質問は次のとおりです。 1)使用できるより良いテストはありますか? 2)そうでない場合、ワトソンのテストの前提は何ですか?パラメトリック/ノンパラメトリックですか? 3)このテストを実行できるアルゴリズムは何ですか?私のデータはMatlabにあり、テストを実行するためにRに転送する必要はありません。むしろ自分の関数を書くだけです。

2
正規性の仮定に対してF検定がそれほど敏感なのはなぜですか?
が大きい場合でも、分散の差のF検定が正規分布の仮定に非常に敏感なのはなぜですか?NNN 私はウェブを検索してライブラリーにアクセスしようとしましたが、良い答えはありませんでした。このテストは、正規分布の仮定の違反に対して非常に敏感であると言っていますが、その理由はわかりません。誰かがこれに対して良い答えを持っていますか?

2
「F回帰」と
フィーチャをF-regressionラベルと個別に関連付け、値を観察するのと同じ方法を使用してフィーチャを比較していますか?R2R2R^2 私は同僚F regressionが機械学習パイプラインで機能の選択にを使用するのをよく見ていますsklearn: sklearn.feature_selection.SelectKBest(score_func=sklearn.feature_selection.f_regression...)` 教えてください-なぜそれをラベル/依存変数と単に相関させるのと同じ結果を与えるのですか? F_regression機能選択で使用することの利点が私には明らかではありません。 ここに私のコードがあります:私はmtcarsからのデータセットを使用していRます: import pandas as pd import numpy as np from sklearn import feature_selection from sklearn.linear_model import LinearRegression #....load mtcars dataset into a pandas dataframe called "df", not shown here for conciseness # only using these numerical columns as features ['mpg', 'disp', 'drat', 'wt'] # …


1
F検定のサンプルサイズの式
F検定に適用されるLehrの式のようなサンプルサイズの式があるかどうか疑問に思っていますか?t検定のための徐冷炉の式は、Δは、効果の大きさである(例えば、Δ = (μ 1 - μ 2)/ σ)。これは、に一般化することができるN = C / Δ 2 cは式I率、所望の電力に依存する定数であり、1つは、片面または両面の試験を行っているかどうか。n=16/Δ2n=16/Δ2n = 16 / \Delta^2ΔΔ\Delta Δ=(μ1−μ2)/σΔ=(μ1−μ2)/σ\Delta = (\mu_1 - \mu_2) / \sigman=c/Δ2n=c/Δ2n = c / \Delta^2ccc F検定の同様の式を探しています。私の検定統計量を有する非中心Fのように、代替の下で、配布され自由と非中心性パラメータの程度N λ、λは唯一未知であるが、いくつかの値を取ることが仮定されている人口のパラメータに依存します。パラメータkは実験によって固定され、nはサンプルサイズです。理想的には、n = cの形式の(できればよく知られている)式を探してい ますk,nk,nk,nnλnλn \lambdaλλ\lambdakkknnn ここで、cはタイプIレートと電力のみに依存します。n=cg(k,λ)n=cg(k,λ)n = \frac{c}{g(k,\lambda)}ccc サンプルサイズが満たすべき ここで、Fは(X 、K 、N 、δ )以外のCDFでありますk 、n dofおよび非心度パラメーターδを持つ中央F 、およびα 、βはタイプIおよびタイプIIのレートです。想定できるF(F−1(1−α;k,n,0);k,n,nλ)=β,F(F−1(1−α;k,n,0);k,n,nλ)=β, F(F^{-1}(1-\alpha;k,n,0);k,n,n\lambda) = …

4
複数のグループの平均を比較するANOVAとネストされたモデルを比較するANOVAの関係は何ですか?
これまで、ANOVAが2つの方法で使用されるのを見てきました。 まず、私の紹介統計テキストでは、平均の1つに統計的有意差があるかどうかを判断するために、ペアワイズ比較に対する改善として、3つ以上のグループの平均を比較する方法としてANOVAが導入されました。 第二に、私の統計学習テキストでは、ANOVAが2つ(またはそれ以上)のネストされたモデルを比較して、モデル2の予測子のサブセットを使用するモデル1がデータに等しく適合するか、または完全なモデル2が優れています。 今、私は何らかの方法でこれら2つの事柄が両方ともANOVAテストを使用しているため、実際には非常によく似ていると思いますが、表面上はかなり異なっているように見えます。1つは、最初の使用で3つ以上のグループを比較し、2つ目の方法では2つのモデルのみを比較できることです。誰かがこれらの2つの使用法の関係を解明してくれませんか?

1
多重代入後の平均比較
欠損値のあるデータについて、グループ間の単純な平均比較(基本的なANOVA F検定)を行う必要があります。多重補完にはR のマウスパッケージを使用していますが、プールできるのは線形モデル係数または結果のみです。R2R2R^2 各線形モデルフィットから複数のF統計をプールするために組み合わせる方法を知っている人はいますか?または、F検定の標準誤差をどのように計算できますか?

1
混合モデルでのt検定とF検定の大きな違い(anovaとlmerTestの要約)
lmerTestによって提供された、Rのlme4における線形混合モデルのt検定とF検定の違いに関する質問に遭遇しました。線形混合モデルのあらゆる種類のp値を計算する際の問題(主に自由度の定義に問題があることが原因であることがわかっているため)と、主な効果の解釈に関する問題を認識しています。重要な相互作用の存在(マージナリティの原則に基づく)。 簡単に言うと、データは2つの条件(合同TRUE / FALSE)の実験からのもので、6セットのセンサーで測定されます。これは、2つの要因の組み合わせとして説明できます。 。 以下の要約出力からわかるように、t.testは有意な合同効果(p = 0.12)を示しませんが、anova出力は非常に有意な合同効果(p = 2.8e-10)を示します。適合性には2つのレベルしかないため、これはF検定が固定因子のいくつかのレベルでオムニバステストを行った結果ではありません。したがって、何がanova出力に非常に重要な結果をもたらすのかはわかりません。これは、もちろんモデルのパラメータ化に主効果を含めることに依存する、合同性を伴う強い相互作用があるという事実によるものですか? CrossValidatedでこの質問に対する以前の回答を探しましたが、おそらくこの質問に対する最初の回答を除いて、関連するものを見つけることができませんでした。しかし、それが本当の答えを提供するのであれば、それは数学に内在しているので、私が助けようとしている人に説明できる概念的な答えを探しています。 > final.mod<-lmer(uV~1+factor(congruity)*factor(laterality)*factor(anteriority)+(1|sent.id)+(1|Subject),data=selected.data) > summary(final.mod) Linear mixed model fit by REML t-tests use Satterthwaite approximations to degrees of freedom ['lmerMod'] Formula: uV ~ 1 + factor(congruity) * factor(laterality) * factor(anteriority) + (1 | sent.id) + (1 | Subject) Data: selected.data …
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.