タグ付けされた質問 「regression-coefficients」

回帰モデルのパラメーター。最も一般的には、従属変数の予測値を取得するために独立変数に乗算される値。

3
相互作用効果が重要でない場合、主な効果をどのように解釈しますか?
Rで一般化線形混合モデルを実行し、2つの予測子間の相互作用効果を含めました。相互作用は重要ではありませんでしたが、主な効果(2つの予測子)は両方とも重要でした。今、多くの教科書の例は、相互作用の重要な効果がある場合、主な効果は解釈できないことを教えてくれます。しかし、相互作用が重要でない場合はどうでしょうか? 2つの予測子が応答に影響を及ぼすと結論付けることはできますか?または、インタラクションを省いた新しいモデルを実行する方が良いでしょうか?複数のテストを制御する必要があるため、そうしないことを好みます。

2
複数のカテゴリ変数がある場合のベータの解釈
私は、概念を理解β 0は、カテゴリ変数は、回帰係数は、2つのカテゴリーの平均値の差があることをエンド解釈を与え、0に等しい(または基準基である)ときの平均です。でも、私はそれぞれ引き受ける> 2つのカテゴリとβは、そのカテゴリの平均値と参照の違いを説明しています。β^0β^0\hat\beta_0β^β^\hat\beta しかし、多変数モデルにさらに多くの変数が取り込まれたらどうなりますか?ここで、2つのカテゴリ変数の参照の平均であることが意味をなさない場合、インターセプトは何を意味しますか?たとえば、性別(M(ref)/ F)と人種(white(ref)/ black)が両方ともモデルに含まれている場合です。ある唯一の白人男性の平均は?他の可能性をどのように解釈しますか?β^0β^0\hat\beta_0 別のメモとして:コントラストステートメントは、効果の変更を調査するための方法として機能しますか?または、さまざまなレベルで効果()を見るだけですか?β^β^\hat\beta

3
ロジスティック回帰の係数の標準誤差を計算する方法
Pythonのscikit-learnを使用して、ロジスティック回帰のトレーニングとテストを行っています。 scikit-learnは、独立変数の回帰係数を返しますが、係数の標準誤差は提供しません。各係数のWald統計を計算し、それらの係数を相互に比較するには、これらの標準誤差が必要です。 ロジスティック回帰の係数の標準誤差を計算する方法の1つの説明を見つけました(ここ)が、従うのはやや困難です。 これらの標準エラーを計算する方法の簡単な簡潔な説明を知っている場合、および/またはそれを私に提供できる場合は、本当に感謝しています!特定のコードを意味するわけではありませんが(役立つコードは自由に投稿してください)、むしろ手順のアルゴリズム的な説明です。

1
重回帰係数の標準誤差?
これは非常に基本的な質問であることを認識していますが、どこにも答えが見つかりません。 正規方程式またはQR分解を使用して回帰係数を計算しています。各係数の標準誤差を計算するにはどうすればよいですか?通常、標準エラーは次のように計算されると考えています。 SEx¯ =σx¯n√SEx¯ =σx¯nSE_\bar{x}\ = \frac{\sigma_{\bar x}}{\sqrt{n}} 各係数のとは何ですか?OLSのコンテキストでこれを計算する最も効率的な方法は何ですか?σx¯σx¯\sigma_{\bar x}

2
Rを使用してロジスティック回帰の係数を計算する
多重線形回帰では、次の式で係数を見つけることができます。 b=(X′X)−1(X′)Yb=(X′X)−1(X′)Yb = (X'X)^{-1}(X')Y beta = solve(t(X) %*% X) %*% (t(X) %*% Y) ; beta 例えば: > y <- c(9.3, 4.8, 8.9, 6.5, 4.2, 6.2, 7.4, 6, 7.6, 6.1) > x0 <- c(1,1,1,1,1,1,1,1,1,1) > x1 <- c(100,50,100,100,50,80,75,65,90,90) > x2 <- c(4,3,4,2,2,2,3,4,3,2) > Y <- as.matrix(y) > X <- as.matrix(cbind(x0,x1,x2)) > …

1
LASSOでカテゴリカル予測子を処理する方法
いくつかのカテゴリ変数予測子といくつかの連続予測子を持つLASSOを実行しています。カテゴリ変数について質問があります。私が理解する最初のステップは、それぞれをダミーに分割し、公正な罰則のために標準化してから退行することです。ダミー変数の処理には、いくつかのオプションがあります。 各要因のダミーのうち1つを除くすべてを含め、その1つを参照レベルとして残します。ダミー係数の解釈は、除外された「参照」カテゴリに関連しています。インターセプトは、参照カテゴリの平均応答です。 各要因の変数をグループ化して、それらがすべて除外されるか、すべてが1つだけ含まれるようにします。私はそれが@Glen_bがここで提案していることだと信じています: 通常、はい、あなたはあなたの要因をすべて一緒に保ちます。glmnetなど、これを行うことができるいくつかのRパッケージがあります。 ここで @Andrew Mが示唆するように、すべてのレベルを含めます。 デフォルトのコントラスト関数を変更することもできます。デフォルトでは、各因子の1レベルが除外されます(治療のコーディング)。しかし、投げ縄のペナルティのため、これは識別可能性のためにもはや必要ではなく、実際、選択された変数の解釈をより複雑にします。これを行うには、設定します contr.Dummy <- function(contrasts, ...){ conT <- contr.treatment(contrasts=FALSE, ...) conT } options(contrasts=c(ordered='contr.Dummy', unordered='contr.Dummy')) 現在、因子のどのレベルが選択されている場合でも、これらの特定のレベルが重要であり、省略されたすべてのレベルではないことを示唆していると考えることができます。機械学習では、ワンコーディングと呼ばれるこのコーディングを見てきました。 質問: これらの各アプローチでの切片と係数の解釈は何ですか? それらの1つを選択する際の考慮事項は何ですか? ダミー係数のスケールを解除してから、オフからオンへの変化として解釈しますか?

1
回帰係数を正規化する方法に関する質問
正規化がここで使用する正しい単語であるかどうかはわかりませんが、私が尋ねようとしていることを説明するために最善を尽くします。ここで使用される推定量は最小二乗です。 、で平均を中心にできると仮定します。ここでおよび、それもはや推定には影響ありません。 Y = β ' 0 + β 1 X ' 1 β ' 0 = β 0 + β 1 ˉ X 1 、X ' 1 = X - ˉ X β ' 0 β 1y=β0+β1x1y=β0+β1x1y=\beta_0+\beta_1x_1y=β′0+β1x′1y=β0′+β1x1′y=\beta_0'+\beta_1x_1'β′0=β0+β1x¯1β0′=β0+β1x¯1\beta_0'=\beta_0+\beta_1\bar x_1x′1=x−x¯x1′=x−x¯x_1'=x-\bar xβ′0β0′\beta_0'β1β1\beta_1 このI平均することにより中と同等です中。最小二乗計算を簡単にするために方程式を減らしました。、Y=β1、X ' 1 β 1、Y=β0+β1X1β^1β^1\hat\beta_1y=β1x′1y=β1x1′y=\beta_1x_1'β^1β^1\hat\beta_1y=β0+β1x1y=β0+β1x1y=\beta_0+\beta_1x_1 一般的にこの方法をどのように適用しますか?モデルがになりました。これをに削減しようとしています。y=β1ex1t+β2ex2ty=β1ex1t+β2ex2ty=\beta_1e^{x_1t}+\beta_2e^{x_2t}y=β1x′y=β1x′y=\beta_1x'

1
2つの回帰係数の比の不偏推定量?
もしA線形/ロジスティック回帰フィット仮定の不偏推定の目的で、1g(y)=a0+a1⋅x1+a2⋅x2g(y)=a0+a1⋅x1+a2⋅x2g(y) = a_0 + a_1\cdot x_1 + a_2\cdot x_2。あなたは、a1とa2の両方が、それらの推定のノイズに対して非常に正であると確信しています。a1a2a1a2\frac{a_1}{a_2}a1a1a_1a2a2a_2 共分散がある場合、答えを計算するか、少なくともシミュレートできます。より良い方法がありますか?また、実際の問題で大量のデータがある場合、推定値の比率を取得するために、またはハーフステップを実行して係数が独立していると仮定するために、どの程度のトラブルが発生しますか?a1,a2a1,a2a_1, a_2


5
線形モデルの因子の有意でないレベルの係数を無視できますか?
ここで線形モデル係数についての明確化を求めた後、因子レベルの係数の重要でない(高いp値)に関するフォローアップの質問があります。 例:線形モデルに10レベルの因子が含まれ、それらのレベルのうち3つだけに有意なp値が関連付けられている場合、モデルを使用してYを予測するときに、被験者が次のいずれかに該当する場合、係数項を含めないことを選択できます非重要レベル? さらに劇的に、7つの重要でないレベルを1つのレベルにまとめて再分析するのは間違っているでしょうか?

2
Rの「係数:14特異点のために定義されていません」などのエラーを処理するにはどうすればよいですか?
GLMを実行して、anovaの出力で「特異点のために定義されていない」エラーが発生した場合、このエラーの発生をどのように防ぐことができますか? 共変量間の共線性によるか、データセットにレベルの1つが存在しないことを示唆する人もいます(lmの「特異点のために定義されていない」の解釈を参照) 私はこれは「特定の治療法は、」モデルを推進して見てみたかったと私は治療の4つのレベルがある場合:Treat 1、Treat 2、Treat 3&Treat 4、として私のスプレッドシートに記録されていますとき、Treat 1残りの1であるゼロで、ときTreat 2ゼロである残りの1です、など、私は何をしなければなりませんか?

2
「思考、高速、低速」の平均への回帰
で思考、高速と低速、ダニエル・カーネマンは、以下の仮定の質問を提起します: (P. 186)現在、ジュリーは州立大学の先輩です。彼女は4歳のときに流readに読んだ。彼女の成績平均点(GPA)とは何ですか? 彼の意図は、特定の統計について予測する際に、平均値への回帰を説明できないことが多いことを説明することです。その後の議論では、彼は次のようにアドバイスしています。 (P. 190)2つの測定値(現在の例では読書年齢とGPA)の間の相関関係は、それらの決定要因間の共有因子の割合に等しいことを思い出してください。その割合についてのあなたの最も良い推測は何ですか?私の最も楽観的な推測は約30%です。この推定を仮定すると、偏りのない予測を作成するために必要なものはすべて揃っています。4つの簡単な手順でそこに到達する方法の手順を次に示します。 平均GPAの推定から始めます。 証拠の印象に合ったGPAを決定します。 読書早熟度とGPAの相関を推定します。 相関が.30の場合、平均から一致するGPAまでの距離の30%を移動します。 彼のアドバイスの私の解釈は次のとおりです。 「彼女は4歳のときに流readに読んだ」を使用して、ジュリーの読書の早熟度の標準スコアを確立します。 対応する標準スコアを持つGPAを決定します。(予測する合理的なGPAは、GPAと早熟度の相関が完全であれば、この標準スコアに対応します。) 読書の早熟度の変動によって説明できるGPAの変動の割合を推定します。(私は彼がこの文脈で「相関」と決定係数を参照していると思いますか?) ジュリーの読書早熟の標準スコアの30%だけが、彼女のGPAの標準スコアを説明できる要因によって説明できるため、ジュリーのGPAの標準スコアがそれの30%になると予測するだけで正当化されます。完全な相関の場合。 カーネマンの手順の私の解釈は正しいですか?もしそうなら、彼の手順、特にステップ4のより正式な数学的正当化はありますか?一般に、2つの変数間の相関関係と標準スコアの変化/差異との関係は何ですか?

3
ロジスティック回帰の係数には意味がありますか?
いくつかの機能からバイナリ分類の問題があります。(正規化された)ロジスティック回帰の係数には解釈可能な意味がありますか? 特徴が事前に正規化されていれば、影響の大きさを示すことができると思いました。しかし、私の問題では、係数は選択した機能に敏感に依存するようです。係数の符号でさえ、入力として選択された異なる特徴セットによって変化します。 係数の値を調べ、最も意味のある係数を見つけて、その意味を言葉で述べる正しい方法は何ですか?一部の適合モデルと係数の符号は間違っていますか?たとえデータに適合した場合でも? (機能間で最も高い相関関係は0.25だけですが、それは確かに役割を果たしますか?)

1
回帰係数と偏回帰係数の違いは何ですか?
私はAbdi(2003)でそれを読みました 独立変数がペアワイズ直交である場合、回帰における各変数の効果は、この独立変数と従属変数間の回帰の勾配を計算することにより評価されます。この場合(つまり、IVの直交性)、偏回帰係数は回帰係数と等しくなります。他のすべての場合、回帰係数は偏回帰係数とは異なります。 ただし、このドキュメントでは、これらの2種類の回帰係数の違いを説明していませんでした。 Abdi、H.(2003)。偏回帰係数。Lewis-Beck M.、Bryman、A.、Futing T.(編)(2003)Encyclopedia of Social Sciences:Research Methods。カリフォルニア州サウザンドオークス:SAGE Publications。

1
OLS係数よりも大きいか、
リッジ回帰を実行する場合、最小二乗の下で対応する係数より大きくなる係数をどのように解釈しますか(特定の値について)?リッジ回帰は単調に係数を縮小すると想定されていませんか?λλ\lambda 関連するノートでは、リッジ回帰中に符号が変化する係数をどのように解釈しますか(つまり、リッジトレースプロットでリッジトレースが負から正に交差する)。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.