タグ付けされた質問 「assumptions」

統計手順が有効な推定値および/または推論を生成する条件を指します。たとえば、多くの統計手法では、データが何らかの方法でランダムにサンプリングされるという仮定が必要です。推定量に関する理論的な結果には、通常、データ生成メカニズムに関する仮定が必要です。

2
反復測定ANOVA:正規性の仮定とは何ですか?
反復測定ANOVAの正規性の仮定について混乱しています。具体的には、どのような正常性を正確に満たす必要があるのか​​と思っています。CVに関する文献と回答を読んで、この仮定の3つの明確な文言に出会いました。 各(繰り返し)条件内の従属変数は、正規分布する必要があります。 rANOVAにはANOVAと同じ仮定に加えて球形性があるとよく言われます。これは、FieldのDiscovering統計と、Wikipediaの主題とLowryのテキストに関する記事の主張です。 残差(考えられるすべてのペア間の差?)は正規分布である必要があります。 私は、CV(上の複数回答でこの文を見つけました1、2)。rANOVAと対になったt検定との類推により、これも直感的に見えるかもしれません。 多変量正規性を満たす必要があります。 ウィキペディアとこのソースはこれに言及しています。また、rANOVAはMANOVA と交換できることを知っています。これはこの主張に値するかもしれません。 これらは何とか同等ですか?私はそれをその多変量正規の手段を知っているすべての私が正しく、後者を理解している場合3.自然に2が含まれるので、のDVの線形結合が正常に配布されます。 これらが同じでない場合、rANOVAの「真の」仮定はどれですか。参照を提供できますか? 私には、最初の主張に対する支持がほとんどあるようです。ただし、これは通常ここで提供される回答と一致していません。 線形混合モデル @utobiのヒントにより、rANOVAを線形混合モデルとして再表現する方法を理解できました。具体的には、経時的モデル方法血圧変化に、私は期待値をモデル化することになる: Y 、I 、Jの血圧の測定値であるが、私の平均血i番目の被験者の圧力、およびi番目の被験者が測定されたj番目の時間としてのt i j、b iE[yij]=ai+bitij,E[yij]=ai+bitij, \mathrm{E}\left[y_{ij}\right]=a_{i}+b_i t_{ij}, yijyijy_{ij}aiaia_{i}iiitijtijt_{ij}jjjiiibibib_i血圧の変化も被験者間で異なることを示しています。被験者のサンプルは母集団のランダムなサブセットにすぎないため、両方の効果はランダムと見なされます。 最後に、私はこれが正常性にとって何を意味するか考えようとしましたが、ほとんど成功しませんでした。McCulloch and Searle(2001、p。35. Eq。(2.14))を言い換えると: E[yij|ai]yij|aiai=ai∼indep. N(ai,σ2)∼i.i.d. N(a,σ2a)E[yij|ai]=aiyij|ai∼indep. N(ai,σ2)ai∼i.i.d. N(a,σa2)\begin{align} \mathrm{E}\left[y_{ij}|a_i\right] &= a_i \\[5pt] y_{ij}|a_i &\sim \mathrm{indep.}\ \mathcal{N}(a_i,\sigma^2) \\[5pt] a_i &\sim \mathrm{i.i.d.}\ \mathcal{N}(a,\sigma_a^2) \end{align} 私はこれを意味すると理解しています 4.各個人のデータは正規に配布する必要がありますが、これは少数の時点でテストするのは不合理です。 私はそれを意味する3番目の表現を取ります 5.個々の被験者の平均は通常分布しています。これらは、上記の3つに加えて別の2つの異なる可能性があることに注意してください。 McCulloch、CE&Searle、SR(2001)。一般化モデル、線形モデル、および混合モデル。ニューヨーク:John …

3
ANOVAの仮定(分散の等価性、残差の正規性)が重要なのはなぜですか?
ANOVAを実行すると、データに適用できるように、テストの特定の仮定が存在する必要があることが通知されます。テストが機能するために次の仮定が必要だった理由について、私は理解できませんでした。 従属変数(残差)の分散は、設計の各セルで等しくなければなりません 従属変数(残差)は、設計の各セルにほぼ正規分布する必要があります。 これらの仮定を満たす必要があるかどうかについて少し灰色の領域があることを理解していますが、議論のために、これらの仮定が特定のデータセットで完全に満たされていない場合、ANOVAを使用する際の問題は何でしょうか?

3
「関連するすべての予測変数」を含める必要が本当にありますか?
推論に回帰モデルを使用する基本的な前提は、「すべての関連する予測子」が予測式に含まれていることです。理論的根拠は、重要な現実世界の要因を含めないと、係数に偏りが生じ、そのため不正確な推論(つまり、変数バイアスの省略)につながるということです。 しかし、研究の実践では、「関連するすべての予測子」に似たものを含む人を見たことはありません。多くの現象には無数の重要な原因があり、それらすべてを含めることは不可能ではないにしても非常に困難です。すぐに使える例は、結果としてうつ病をモデル化することです:「関連するすべての変数」を含むモデルに近いものは誰も作成していません:例えば、親の歴史、性格特性、ソーシャルサポート、収入、それらの相互作用など。等... さらに、そのような複雑なモデルのフィッティングは、非常に大きなサンプルサイズがない限り、非常に不安定な推定値につながります。 私の質問は非常に簡単です。「関連するすべての予測変数を含める」という仮定/アドバイスは、単に「言う」が、実際には決して意味のないものですか。そうでない場合、なぜ実際のモデリングのアドバイスとしてそれを与えるのですか? そして、これはほとんどの係数がおそらく誤解を招くことを意味しますか?(たとえば、いくつかの予測因子のみを使用する人格要因とうつ病に関する研究)。言い換えれば、これは私たちの科学の結論にとってどれほど大きな問題なのでしょうか?

5
線形回帰の仮定の必要性は何ですか?
線形回帰では、次の仮定を行います 予測子の値の各セットでの応答の平均 は、予測子の線形関数です。E(Y私)E(Y私)E(Y_i)(x1 i、x2 i、… )(バツ1私、バツ2私、…)(x_{1i}, x_{2i},…) エラーε私ε私ε_iは独立しています。 予測子の各値セット(x_ {1i}、x_ {2i}、…)での誤差ε私ε私ε_iは、正規分布しています。(x1 i、x2 i、… )(バツ1私、バツ2私、…)(x_{1i}, x_{2i},…) 予測子の各値セット(x_ {1i}、x_ {2i}、…)での誤差ε私ε私ε_i、 等しい分散(σ2と表示)があります。(x1 i、x2 i、… )(バツ1私、バツ2私、…)(x_{1i}, x_{2i},…)σ 2σ2σ2 線形回帰を解く方法の1つは、次のように記述できる正規方程式を使用することです。 θ = (XTバツ)− 1バツTYθ=(バツTバツ)−1バツTY\theta = (X^TX)^{-1}X^TY 数学的な観点から、上記の方程式はX ^ TXのみバツTバツバツTバツX^TXが可逆的であることを必要とします。では、なぜこれらの仮定が必要なのでしょうか?数人の同僚に尋ねたところ、良い結果を得るためであり、正規方程式はそれを達成するためのアルゴリズムであると述べました。しかし、その場合、これらの仮定はどのように役立ちますか?それらを守ることは、より良いモデルを得るのにどのように役立ちますか?

2
線形回帰には残差に関する仮定があるのに、一般化線形モデルには応答に関する仮定があるのはなぜですか?
線形回帰と一般化モデルに一貫性のない仮定があるのはなぜですか? 線形回帰では、残差がガウス型になると仮定します 他の回帰(ロジスティック回帰、ポイズン回帰)では、応答が何らかの分布(二項分布、ポアソンなど)から生じると想定しています。 なぜ残余を想定し、他の時間は応答を想定するのですか?異なるプロパティを導出したいからですか? 編集:mark999は2つの形式が等しいことを示していると思います。しかし、私はiidに関してもう1つの疑問を持っています。 私の他の 質問、ロジスティック回帰にiidの仮定はありますか?一般化線形モデルにiidの仮定がないことを示します(独立していますが同一ではありません) 線形回帰の場合、残差に仮定を設定するとiidが得られますが、応答に仮定を設定すると、独立ではあるが同一ではないサンプル(異なる異なるガウス)になりますか?μμ\mu

3
OLS推定量を導出するための仮定
誰かが私のために簡単に説明できますか、なぜOLS推定量を計算するために6つの仮定のそれぞれが必要ですか?多重共線性についてのみ見つけました。それが存在する場合、マトリックスを反転(X'X)できず、全体の推定量を推定できません。その他(線形性、ゼロ平均誤差など)はどうですか?

1
一般化線形モデルの仮定
単一の応答変数(連続/正規分布)と4つの説明変数(3つは因子で、4つ目は整数)を使用して、一般化線形モデルを作成しました。アイデンティティリンク関数でガウス誤差分布を使用しました。現在、モデルが一般化線形モデルの仮定を満たしていることを確認しています: Yの独立 正しいリンク機能 説明変数の正しい尺度 影響のある観測はありません 私の質問は、モデルがこれらの仮定を満たしていることをどのように確認できますか?最良の出発点は、各説明変数に対して応答変数をプロットすることです。ただし、説明変数のうち3つはカテゴリ(1〜4レベル)であるため、プロットで何を探す必要がありますか? また、説明変数間の多重共線性と相互作用をチェックする必要がありますか?はいの場合、カテゴリー説明変数を使用してこれを行うにはどうすればよいですか?

2
部分最小二乗(PLS)回帰のモデル仮定
PLS回帰の仮定に関する情報(単一)を見つけようとしています。特に、OLS回帰の前提に関するPLSの前提の比較に興味があります。 yyy PLSのトピックに関する多くの文献を読んだり、読み飛ばしたりしました。Wold(Svante and Herman)、Abdi、および他の多くの論文ですが、満足できる情報源は見つかりませんでした。 ウォルド等。(2001)PLS回帰:ケモメトリックスの基本ツールはPLSの仮定に言及していますが、それだけに言及しています Xは独立している必要はありませんが、 システムは、いくつかの潜在的な潜在変数の関数です。 システムは分析プロセス全体で均一性を示す必要があります。 測定誤差は許容範囲です。 バツバツX 観測されたデータの要件やモデルの残差に関する言及はありません。誰もがこれに対処するソースを知っていますか?(と間の共分散を最大化する目的で)基礎となる数学がPCAに類似していると考えると、多変量正規性は仮定ですか?モデルの残差は分散の均一性を示す必要がありますか?yyyバツバツX( y、 X)(y、バツ)(y, X) また、観測は独立している必要はないことをどこかで読んだと思います。これは、反復測定研究の意味で何を意味しますか?

2
の値を使用して、重回帰分析で線形性の仮定をテストするにはどうすればよいですか?
以下のグラフは、「正常性」、「同相性」、「独立性」の仮定が確実に満たされている回帰テストの残差散布図です。「線形性」の仮定をテストする場合、グラフを見ると関係が曲線であると推測できますが、問題は次のとおりです。「R2線形」の値を使用して線形性の仮定をテストできますか?関係が線形であるかどうかを判断するための「R2 Linear」の値の許容範囲はどのくらいですか?線形性の仮定が満たされておらず、IVの変換も役に立たない場合はどうすればよいですか?!! テストの全結果へのリンクはこちらです。 散布図:

6
内因性と観察されていない異質性
内因性と観察されない異質性の違いは何ですか?内生性は、たとえば、省略された変数から来ることを知っていますか?しかし、私の知る限り、観測されていない不均一性が同じ問題を引き起こしています。しかし、これら2つの概念の違いはどこにあるのでしょうか?

2
GLMのファミリーは、応答変数または残差の分布を表しますか?
私はこれについていくつかの研究室のメンバーと議論してきました、そして私たちはいくつかの情報源に行きましたが、まだ答えがありません: GLMにポアソンのファミリーがあると言うとき、残差の分布または応答変数について話していますか? 競合のポイント この記事を読むと、GLMの仮定は、観測の統計的独立性、リンクと分散関数の正しい仕様(応答変数ではなく残差について考えるようになる)、応答変数の正しい測定スケールであると述べています。単一ポイントの過度の影響の欠如 この質問には、それぞれ2つのポイントを持つ2つの答えがあります。最初に表示されるのは残差について、2番目は応答変数についてです。 このブログ投稿では、仮定について話しているときに、「残差の分布は他のもの、たとえば二項分布である可能性がある」と述べています。 この章の冒頭で、彼らはエラーの構造はポアソンでなければならないが、残差は確かに正と負の値を持っていると言います。どうしてポアソンになりますか? この質問は、複製するためにこのような質問でよく引用されますが、受け入れられた答えはありません この質問の答えは、残差ではなく応答について語っています で、この Pensilvaniaの大学からのコースの説明彼らは仮定ではなく、残差に応答変数について話します

3
仮説検定で尖度の高い尖度が問題になるのはなぜですか?
残差の高正尖度は、正確な仮説検定と信頼区間(したがって統計的推論の問題)にとって問題になる可能性があると聞きました(テキストへのリンクを提供することはできません)。これは本当ですか、もしそうなら、なぜですか?残差の高い正の尖度は、残差の大部分が残差平均0に近いことを示していないので、残差が少ないことがわかりますか (答えがある場合は、数学的にあまり傾いていないので、あまり詳しくない数学で答えてみてください)。

3
ロジスティック回帰(または他の形式の回帰)での非線形性のテスト
ロジスティック回帰の前提の1つは、ロジットの線形性です。したがって、モデルを立ち上げて実行したら、Box-Tidwellテストを使用して非線形性をテストします。私の連続予測変数(X)の1つは、非線形性が陽性であることをテストしました。次に何をするつもりですか? これは仮定の違反であるため、予測変数(X)を取り除くか、非線形変換(X * X)を含める必要があります。または、変数をカテゴリカルに変換しますか?あなたが参照を持っているなら、あなたも私にそれを指し示すことができますか?

4
ロジスティック回帰分析で連続独立変数のロジットへの線形性の仮定をどのようにチェックする必要がありますか?
ロジスティック回帰分析における連続予測子変数のロジットへの線形性の仮定と混同しています。単変量ロジスティック回帰分析を使用して潜在的な予測子をスクリーニングしながら、線形関係をチェックする必要がありますか? 私の場合は、多重ロジスティック回帰分析を使用して、参加者間の栄養状態(二分結果)に関連する要因を特定しています。年齢、Charlson併存症スコア、Barthel Indexスコア、握力、GDSスコア、BMIなどの連続変数。最初のステップは、単純なロジスティック回帰を使用して有意な変数をスクリーニングすることです。各連続変数の単純なロジスティック回帰分析中に線形性の仮定を確認する必要がありますか?それとも、最終的な多重ロジスティック回帰モデルで確認するだけですか? さらに、私の理解のために、モデルに入力する前に非線形連続変数を変換する必要があります。変換の代わりに非線形連続変数を分類できますか?

3
Normalエラーの仮定は、YもNormalであることを意味しますか?
誤解しない限り、線形モデルでは、応答の分布には系統的な成分とランダムな成分があると想定されます。エラー項は、ランダム成分をキャプチャします。したがって、エラー項が正規分布であると仮定した場合、応答も正規分布であることを意味しないのでしょうか?私はそれを行うと思いますが、その後、次のようなステートメントはかなり混乱しているように見えます: そして、このモデルの「正規性」の唯一の仮定は、残差(または「エラー」)が正規分布することであることが明確にわかります。予測子x iまたは応答変数y iの分布に関する仮定はありません。ϵiϵi\epsilon_ixixix_iyiyiy_i 出典:予測子、応答、および残差:正規分布に実際に必要なものは何ですか?

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.