タグ付けされた質問 「regression」

1つ(または複数)の「従属」変数と「独立」変数の間の関係を分析する手法。

1
Rの「マルチノム」のp値の取得(nnetパッケージ)
パッケージのmultinom関数を使用してp値を取得するにはどうすればよいですか?nnetR 結果変数として「病理スコア」(不在、軽度、重度)、および2つの主な効果で構成されるデータセットがあります。 ATB1;感染+ ATB2;感染+ ATB3)。 最初に、順序変数回帰モデルを適合させようとしました。これは、私の従属変数(順序)の特性を考えると、より適切と思われます。ただし、オッズの比例性の仮定は(グラフィック的に)大きく違反しているため、代わりにnnetパッケージを使用して多項モデルを使用する必要がありました。 最初に、ベースラインカテゴリとして使用する必要がある結果レベルを選択しました。 Data$Path <- relevel(Data$Path, ref = "Absent") 次に、独立変数のベースラインカテゴリを設定する必要がありました。 Data$Age <- relevel(Data$Age, ref = "Twenty") Data$Treat <- relevel(Data$Treat, ref="infected without ATB") モデル: test <- multinom(Path ~ Treat + Age, data = Data) # weights: 18 (10 variable) initial value 128.537638 iter 10 value 80.623608 final …

3
ARIMAモデルの解釈
この質問は、相互検証で回答できるため、Mathematics Stack Exchangeから移行されました。 7年前に移行され ました。 ARIMAモデルについて質問があります。のは、私は時系列があるとしましょうYtYtY_t私は予想してしたいことをARIMA (2 、2 )有馬(2、2)\text{ARIMA}(2,2)モデルは、予測演習を実施するための良い方法のように思えます。 遅れたは、今日のシリーズが以前のイベントの影響を受けていることを示しています。意味あり。しかし、エラーの解釈は何ですか?私の以前の残差(私の計算でどの程度外れていたか)は、今日の私のシリーズの価値に影響を与えていますか?回帰の積/残余であるため、この回帰では時間差残差はどのように計算されますか?Δ Yt= α1Δ Yt − 1+ α2Δ Yt − 2+ νt+ θ1νt − 1+ θ2νt − 2△Yt=α1△Yt−1+α2△Yt−2+νt+θ1νt−1+θ2νt−2 \Delta Y_t = \alpha_1 \Delta Y_{t-1} + \alpha_2 \Delta Y_{t-2} + \nu_{t} + \theta_1 \nu_{t-1} + \theta_2 \nu_{t-2} YYY

1
Rでの複数のメディエーション分析
Rで複数のメディエーションモデルを実行する方法を誰かが知っているのではないかと思っています。メディエーションパッケージでは複数の単純なメディエーションモデルを使用できますが、複数のメディエーションモデルを同時に評価する1つのモデルを実行したいと思います。 私はこれをSEMフレームワーク(パス分析)で行うことができると仮定していますが、複数のメディエーターのメディエーション分析に典型的な統計を計算するパッケージの新しい人(間接効果、メディエーションによるトータル効果の割合など)、ブートストラップを利用できます。私はこれが長いショットであることを知っていますが、ゼロから開発する時間を投資する前に尋ねるべきだと思いました。 更新日:(11/11/2013) 数年前にこの質問をして以来、私は素晴らしいRパッケージlavaanを使用して複数の調停を行うことを学びました。 コードの例を次に示します。 model <- ' # outcome model outcomeVar ~ c*xVar + b1*medVar1 + b2*medVar2 # mediator models medVar1 ~ a1*xVar medVar2 ~ a2*xVar # indirect effects (IDE) medVar1IDE := a1*b1 medVar2IDE := a2*b2 sumIDE := (a1*b1) + (a2*b2) # total effect total := c + (a1*b1) …

3
lm()とrlm()の違いは何ですか?
この質問は、相互検証で回答できるため、Stack Overflowから移行されました。 8年前に移行され ました。 ライブラリで「線形モデルのロバスト近似」rlm() 関数MASSを見つけました。 この関数と標準線形回帰関数の違いを知りたいlm()です。 誰かが簡単な説明をくれますか?
19 r  regression 


1
適合度と線形回帰またはポアソンを選択するモデル
私の研究では、3つの大きな医薬品とイノベーションのケーススタディである2つの主なジレンマに関するアドバイスが必要です。年間の特許数は従属変数です。 私の質問は 良いモデルの最も重要な基準は何ですか?重要なことは何ですか?ほとんどまたはすべての変数が重要になるのでしょうか?「F STATISTIC」の問題ですか?「調整済みRの2乗」の値ですか? 第二に、研究に最適なモデルをどのように決定できますか?カウント変数(多分ポアソンカウント)である特許のほかに、資産収益率、研究開発予算、繰り返されるパートナー(バイナリ変数ではない%)、企業規模(従業員)などの説明変数があります。線形回帰またはポアソンを実行する必要がありますか?

2
因子/変数をどのように「制御」しますか?
私の理解では、「コントロール」には統計上で2つの意味があります。 対照群:実験では、対照群のメンバーに治療は施されていません。例:プラセボと薬物:あるグループに薬物を投与し、他のグループ(対照)には投与しません。これは「制御実験」とも呼ばれます。 変数の制御:特定の独立変数の効果を分離する手法。この技術に与えられた他の名前のいくつかは、「会計」、「保持定数」、「制御」、いくつかの変数です。例:サッカー視聴調査(好きか嫌いか)では、性別がバイアスを引き起こすと考えられるため、性別の影響を取り除くことができます。つまり、男性は女性よりもそれを好む可能性があります。 したがって、私の質問はポイント(2)に対するものです。2つの質問: 一般的に、どのようにして変数を「制御」/「アカウント」しますか。どのようなテクニックが使用されていますか?(回帰の観点から、ANOVAフレームワーク)。 上記の例では、男性と女性をランダムに選択することがコントロールを構成していますか?つまり、「ランダム」は他の効果を制御するためのテクニックの1つですか?

5
1と0を含む比率データのベータ回帰
0と1の間の比率である応答変数を持つモデルを作成しようとしています。これには、かなりの数の0と1が含まれますが、その間の多くの値も含まれます。ベータ回帰を試みることを考えています。R(betareg)で見つかったパッケージでは、0から1の間の値のみが許可されますが、0または1自体は含まれません。私は理論的にはベータ分布が0または1の値を処理できるはずであることを他の場所で読みましたが、RIでこれを処理する方法がわかりませんが、ゼロに0.001を追加し、1から0.001を取る人がいますこれは良いアイデアだと思いますか? あるいは、応答変数をロジット変換し、線形回帰を使用することもできます。この場合、ログ変換できない0と1の問題があります。

2
分散に関する回帰はなぜですか?
私はこのメモを読んでいます。 2ページに、次のように記載されています。 「データの分散は、特定の回帰モデルによってどの程度説明されますか?」 「回帰の解釈は係数の平均に関するものであり、推論はそれらの分散に関するものです。」 私はそのような声明について何度も読みましたが、なぜ「データの分散が与えられた回帰モデルによってどれほど説明されるのか」を気にするのはなぜでしょうか...より具体的には、なぜ「分散」なのでしょうか?

3
回帰のランダムフォレストは「真の」回帰ですか?
回帰にはランダムフォレストが使用されます。しかし、私が理解していることから、彼らは各葉に平均目標値を割り当てています。各ツリーのリーフは限られているため、回帰モデルからターゲットが達成できる特定の値のみがあります。したがって、それは単なる「離散」回帰(ステップ関数のような)ではなく、「連続」な線形回帰ではないのでしょうか? これを正しく理解していますか?はいの場合、ランダムフォレストは回帰においてどのような利点を提供しますか?

2
バイナリの結果と予測子でロジスティック回帰を使用するのは理にかなっていますか?
バイナリの結果変数{0,1}と予測変数{0,1}があります。私の考えでは、他の変数を含めてオッズ比を計算しない限り、ロジスティックを行うのは理にかなっていません。 1つのバイナリ予測子では、確率の計算はオッズ比に対して十分ではないでしょうか?

2
LASSOには、段階的回帰と同じ問題がありますか?
段階的アルゴリズムの変数選択方法は、回帰モデルのすべての推定値(およびそのSE、p値、F統計量など)に多かれ少なかれバイアスをかけるモデルを選択する傾向があり、ほぼ真の予測子を除外する可能性が高い適度に成熟したシミュレーション文献によると、誤った予測変数を含めます。ββ\beta LASSOは、変数を選択するために使用される場合、同じ特定の方法で影響を受けますか?

6
ワイン評価を予測する線形回帰または順序ロジスティック回帰(0〜10)
ここから、0から10までの値を持つ各エントリに関連付けられた従属評価を持つ11の数値独立変数で構成されるワインデータがあります。これは、変数と関連する変数との関係を調べるために回帰モデルを使用するのに最適なデータセットになります評価。しかし、線形回帰は適切でしょうか、または多項/順序付きロジスティック回帰を使用する方が良いでしょうか? ロジスティック回帰は、特定のカテゴリ、つまり連続従属変数ではないが、(1)11のカテゴリ(少し多すぎる?)があり、(2)検査時に、それらのカテゴリのうち6〜7のデータ、つまり残りの5-4のカテゴリには、データセットに例がありません。 一方、線形回帰では、0〜10の間の評価を線形に推定する必要があります。これは、私が見つけようとしているものに近いようです。それでも、従属変数はデータセット内で連続的ではありません。 どちらが良いアプローチですか?注:分析にRを使用しています 回答に記載されているいくつかのポイントに対処して編集します。 これは実際には大学のコースであるため、ビジネス目標はありません。タスクは、私が適切と思う方法で、選択したデータセットを分析することです。 評価の分布は正常に見えます(ヒストグラム/ qqプロット)。データセットの実際の値は3〜8です(技術的には0〜10です)。

2
ロジスティック回帰にiidの仮定はありますか?
ロジスティック回帰の応答変数にiidの仮定はありますか? たとえば、データポイントがあるとします。応答は、ベルヌーイ分布から来ているようです。したがって、異なるパラメーター持つベルヌーイ分布を持つ必要があります。100010001000YiYiY_ipi=logit(β0+β1xi)pi=logit(β0+β1xi)p_i=\text{logit}(\beta_0+\beta_1 x_i)100010001000ppp したがって、それらは「独立」していますが、「同一」ではありません。 私は正しいですか? PS。「機械学習」の文献からロジスティック回帰を学びました。そこでは、目的関数を最適化し、仮定についてあまり語ることなく、データのテストに適しているかどうかを確認します。 私の質問は、この投稿で始まりました。一般化線形モデルのリンク関数の理解ここで、統計的仮定の詳細を調べます。

6
最小二乗推定量の分散における項の直感的な説明
がフルランクの場合、逆数が存在し、最小二乗推定値を取得します。 およびX T X β = (X T X )- 1 X Y ヴァー(β)= σ 2(X T X )- 1XXXXTXXTXX^TXβ^=(XTX)−1XYβ^=(XTX)−1XY\hat\beta = (X^TX)^{-1}XYVar(β^)=σ2(XTX)−1Var⁡(β^)=σ2(XTX)−1\operatorname{Var}(\hat\beta) = \sigma^2(X^TX)^{-1} 分散式でをどのように直感的に説明できますか?派生のテクニックは私にとって明らかです。(XTX)−1(XTX)−1(X^TX)^{-1}

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.