タグ付けされた質問 「linear-model」

確率変数が有限数のパラメーターで線形である関数によって1つ以上の確率変数に関連付けられているモデルを指します。

3
「線形」回帰と「非線形」回帰を区別することが重要なのはなぜですか?
線形モデルと非線形モデルの区別の重要性は何ですか?非線形モデルと一般化線形モデルの質問:ロジスティック、ポアソンなどの回帰をどのように参照しますか?そしてその答えは、一般化線形モデルの線形性/非線形性の非常に役立つ説明でした。線形モデルと非線形モデルを区別することは非常に重要であるように思えますが、その理由は明確ではありません。たとえば、次の回帰モデルを検討してください。 E[Y∣X]E[Y∣X]E[Y∣X]E[Y∣X]=β0+β1X=β0+β1X+β2X2=β0+β21X={1+exp(−[β0+β1X]}−1(1)(2)(3)(4)(1)E[Y∣X]=β0+β1X(2)E[Y∣X]=β0+β1X+β2X2(3)E[Y∣X]=β0+β12X(4)E[Y∣X]={1+exp⁡(−[β0+β1X]}−1\begin{align} E[Y \mid X] & = \beta_0 + \beta_1 X \tag{1} \\ E[Y \mid X] & = \beta_0 + \beta_1 X + \beta_2 X^2 \tag{2} \\ E[Y \mid X] & = \beta_0 + \beta_1^2 X \tag{3} \\ E[Y \mid X] & = \{1+\exp(-[ \beta_0 + \beta_1 X]\}^{-1} \tag{4} \end{align} …

1
ガウス線形モデルのF検定が最も強力なのはなぜですか?
線形モデルガウス用μは、いくつかのベクトル空間にあると仮定されると標準正規分布で有するの統計のための検定ここで、はベクトル空間であり、逸脱統計量の増加する1対1関数です: f = \ phi \ left(2 \ log \ frac {\ sup _ {\ mu \ in W、\ sigma> 0} L(\ mu、\ sigma | y)} {\ sup _ {\ mu \ in U、\ sigma> 0} L(\ mu、\ sigma | y)} \ right)。 この統計がH_0の最も強力なテストを提供することをどのようにして知ることができますかY=μ+σGY=μ+σGY=\mu+\sigma Gμμ\muG R N F H 0:{ …


1
Rのlmとbiglmが同じデータに対して異なるp値を与えるのはなぜですか?
ここに小さな例があります: MyDf<-data.frame(x=c(1,2,3,4), y=c(1.2, .7, -.5, -3)) 今とbase::lm: > lm(y~x, data=MyDf) %>% summary Call: lm(formula = y ~ x, data = MyDf) Residuals: 1 2 3 4 -0.47 0.41 0.59 -0.53 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 3.0500 0.8738 3.491 0.0732 . x -1.3800 0.3191 -4.325 0.0495 * --- …


3
複数の新しいラインで散布図を議論する方法は?
2つの変数を測定しましたが、散布図は複数の「線形」モデルを示唆しているようです。それらのモデルを蒸留しようとする方法はありますか?他の独立変数を識別することは困難であることが判明しました。 両方の変数は大きく左に歪んでいます(小さな数字に向かって)。これは、私たちのドメインで予想される分布です。ドットの強度は、この&lt; x 、y &gt;でのデータポイントの量(スケール)を表します。 log10log10\log_{10}&lt;x,y&gt;&lt;x,y&gt; あるいは、ポイントをクラスター化する方法はありますか? 私たちの分野では、これらの2つの変数は線形に相関すると主張されています。私たちは、なぜデータに当てはまらないのかを理解/説明しようとしています。 (注、1700万のデータポイントがあります) 更新:すべての答えに感謝します、ここにいくつかの要求された説明があります: 両方の変数は整数のみであり、対数散布図のパターンの一部を説明しています。 幸い、定義により、両方の変数の最小値は1です。 7M点はである(データの左歪度によって「説明」)&lt;3,1&gt;&lt;3,1&gt;<3,1> 要求されたプロットは次のとおりです。 対数散布図: (空白は整数値が原因です) log-log polar: θ=yθ=y\theta = y 比率のヒストグラム: 以来周波数は、対数スケールであるバー7M点であり、他のバーを隠すことになります。1/31/31/3

5
教授から回帰モデルを隠す(回帰戦艦)[終了]
休業。この質問には詳細または明確さが必要です。現在、回答を受け付けていません。 この質問を改善してみませんか?詳細を追加し、この投稿を編集して問題を明確にしてください。 2年前休業。 私は宿題に取り組んでいます。教授は、本当の回帰モデルを作成し、データのサンプルをシミュレートし、クラスで学んだいくつかの手法を使用して本当の回帰モデルを見つけようとしています。同様に、彼から提供されたデータセットでも同じことを行う必要があります。 彼は、彼をだまそうとする過去のすべての試みのためにかなり正確なモデルを生み出すことができたと言います。いくつかの非常識なモデルを作成する学生もいましたが、彼は間違いなく、十分なだけの単純なモデルを作成することができました。 彼が見つけるためのトリッキーなモデルを開発するにはどうすればよいですか?4つの2次項、3つの観測、および大規模な分散を行うことで、超安価になりたくないですか?その下にタフな小さなモデルがある一見無害なデータセットを作成するにはどうすればよいですか? 彼は単に従うべき3つのルールを持っています: データセットには、1つの「Y」変数と、「Y」、「X1」、...、「X20」というラベルが付いた20個の「X」変数が必要です。 あなたの応答変数:満たしていることを線形回帰モデルから来なければならないY " I = β 0 + β 1 X " I 1 + ... + β のp - 1 X " I 、P - 1 + ε I ε I〜N (0 、σ 2)及びP ≤ 21。YYY Y』私= β0+ β1バツ』私1+ … + βp …

1
予測間隔=信頼できる間隔?
予測間隔と信頼できる間隔が同じことを評価するかどうか疑問に思っています。 たとえば、線形回帰の場合、近似値の予測区間を推定するとき、値が下がると予想される区間の限界を推定します。信頼区間とは逆に、平均値などの分布パラメーターに焦点を合わせるのではなく、説明変数が特定のX値に対して取ることができる値に焦点を合わせます(と想定)。Y = +のB 。バツ(1 - α )%(1−α)%(1-\alpha)\% Y= a + b 。バツ Y=a+b。バツ\ Y = a + b.X ベイジアンフレームワーク内の特定の値の近似値を事後確率分布から推定する場合、信頼できる区間を推定できます。この間隔は、近似値について同じ情報を提供しますか?バツバツX

1
ログに記録された結果変数の負の線形回帰係数を解釈するにはどうすればよいですか?
従属変数がログに記録され、独立変数が線形である線形回帰モデルがあります。主要な独立変数の勾配係数は負です: .。解釈の仕方がわからない。− .0564−.0564-.0564 絶対値を使用してから、次のように負に変換しますか? (exp(0.0564 )- 1 )⋅ 100 = 5.80(exp⁡(0.0564)−1)⋅100=5.80(\exp(0.0564)-1) \cdot 100 = 5.80 または 次のように負の係数を接続しますか? (exp(- 0.0564 )- 1 )⋅ 100 = - 5.48(exp⁡(−0.0564)−1)⋅100=−5.48(\exp(-0.0564)-1) \cdot 100 = -5.48 つまり、絶対値を使用してからそれを負に変換するのですか、それとも負の係数を接続するのですか?Xの1単位の増加は、Yの__パーセントの減少に関連しているという点で、私の発見をどのように表現しますか?ご覧のとおり、これらの2つの数式は2つの異なる答えを生成します。

2
lmのデフォルトの診断プロットへの可能な拡張(Rおよび一般的に)?
plot.lm関数を少し掘り始めました。この関数はlmに6つのプロットを提供します。 近似値に対する残差のプロット フィットされた値に対するsqrt(|残差|)のスケール-ロケーションプロット 通常のQQプロット、クックの距離と行ラベルのプロット レバレッジに対する残差のプロット レバレッジ/(1-レバレッジ)に対するクックの距離のプロット そして、私は現在のプロットの他の一般的な/有用な拡張が線形モデルにどのように存在するのか、そしてそれらをRでどのように行うことができるのでしょうか?(パッケージの記事へのリンクも歓迎します) そのため、boxcox関数({MASS}から)は別の有用な診断プロットの例です(そのような答えはすばらしいでしょう)が、Rのlmの既存のデフォルト診断プロットのバリエーション/拡張についてもっと知りたいです(ただし、一般的なトピックに関する他の発言は常に歓迎されます)。 ここに私が意味することのいくつかの簡単な例があります: #Some example code for all of us to refer to set.seed(2542) x1 &lt;- rnorm(100) x2 &lt;- runif(100, -2,2) eps &lt;- rnorm(100,0,2) y &lt;- 1 + 2*x1 + 3*x2 + eps y[1:4] &lt;- 14 # adding some contaminated points fit &lt;- lm(y~x1+x2) …

2
lm()を使用する場合のRの重み引数の背後にある理論
聞かせて:大学院における年後、 "加重最小二乗"の私の理解は以下の通りである、いくつかのことデザイン行列、\をboldsymbol \ beta \ in \ mathbb {R} ^ pはパラメータベクトルであり、\ boldsymbol \ epsilon \ in \ mathbb {R} ^ nは、\ boldsymbol \ epsilon \ sim \ mathcal {N}(\ mathbf {0}、\ sigma ^ 2 \ mathbf {V})、ここで\ mathbf {V} = \ text {diag}(v_1、v_2、\ dots、v_n)および\ sigma ^ 2&gt; 0。次に、モデル \ mathbf …

4
統計でのデシベルの使用
RFIDタグを読み取り、アンテナ構成(アンテナの数、位置など)を変更したときにリーダーが見る信号強度を比較するプロジェクトに取り組んでいます。プロジェクトの一環として、セットアップを比較して、どちらが最も効果的かを確認する必要があります。 理想的には、2つのアンテナ位置間で対のないt検定またはANOVA(または複数の間のMANOVA)を実行できます。しかし、応答は対数であるデシベル単位であるため、それを進めるための最良の方法は何ですか? 結果を線形スケールに変換してから、先ほど述べた方法の1つを使用して比較するのが最善でしょうか、それともデシベルを別の統計的検定と同じように使用して比較するのですか?

5
OLS推定器がスケール同変であることを示していますか?
スケールの等分散性の正式な定義はありませんが、統計学習の概要でこれについてp。217: 標準的な最小二乗係数...であるスケールequivariant:乗算XjXjX_j定数ccc倍最小二乗係数推定値のスケーリングに単にリード1/c1/c1/c。 簡略化のため、の一般線形モデル仮定するy=Xβ+ϵy=Xβ+ϵ\mathbf{y} = \mathbf{X}\boldsymbol\beta + \boldsymbol\epsilon、ここで、y∈RNy∈RN\mathbf{y} \in \mathbb{R}^N、XX\mathbf{X}であるN×(p+1)N×(p+1)N \times (p+1)行列(p+1&lt;Np+1&lt;Np+1 < Nのすべてのエントリを持つ)RR\mathbb{R}、β∈Rp+1β∈Rp+1\boldsymbol\beta \in \mathbb{R}^{p+1}、及びϵϵ\boldsymbol\epsilonあるNNNと実数値の確率変数の次元ベクトルE[ϵ]=0N×1E[ϵ]=0N×1\mathbb{E}[\boldsymbol\epsilon] = \mathbf{0}_{N \times 1}。 OLS推定から、我々は知っているならばXX\mathbf{X}フル(列)ランク持っている β X = (X T X )- 1 X T Yを。β^X=(XTX)−1XTy.β^X=(XTX)−1XTy.\hat{\boldsymbol\beta}_{\mathbf{X}} = (\mathbf{X}^{T}\mathbf{X})^{-1}\mathbf{X}^{T}\mathbf{y}\text{.} 我々はの列乗算仮定XX\mathbf{X}、言うxkxk\mathbf{x}_kいくつかについてk∈{1,2,…,p+1}k∈{1,2,…,p+1}k \in \{1, 2, \dots, p+1\}定数によって、c≠0c≠0c \neq 0。これは、行列 X⎡⎣⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢11⋱1c1⋱1⎤⎦⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥S=[x1x2⋯cxk⋯xp+1]≡X~X[11⋱1c1⋱1]⏟S=[x1x2⋯cxk⋯xp+1]≡X~\begin{equation} \mathbf{X}\underbrace{\begin{bmatrix} 1 & \\ & 1 \\ & …

1
線形回帰における正規性の仮定
線形回帰の仮定として、エラーの分布の正規性は、誤って「拡張」されるか、yまたはxの正規性の必要性として解釈されることがあります。 XとYが非正規であるが、エラー項があり、したがって得られた線形回帰推定が有効であるシナリオ/データセットを構築することは可能ですか?

3
2つの勾配の差を計算する方法は?
2本の線が(多かれ少なかれ)平行であるかどうかを理解する方法はありますか?線形回帰から生成された2本の線があり、それらが平行かどうかを知りたいのですが。つまり、この2つの線の傾きの違いを知りたいのです。 これを計算するR関数はありますか? 編集: ...そして線形回帰直線の傾き(度単位)をどのように取得できますか?

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.