多重線形回帰モデルを記述または視覚化する方法


21

いくつかの入力パラメーター、たとえば3を使用して、多重線形回帰モデルをデータに適合させようとしています。

(私)Fバツ=Aバツ1+Bバツ2+Cバツ3+dまたは(ii)Fバツ=A B CTバツ1 バツ2 バツ3+d

このモデルを説明して視覚化するにはどうすればよいですか?次のオプションが考えられます。

  1. このモデルの精度を示すために、標準偏差と(係数、定数)で説明されているように回帰方程式に言及し、次に残差プロットに言及します。

  2. 次のような独立変数と従属変数のペアワイズプロット:

    ここに画像の説明を入力してください

  3. 係数がわかったら、式を取得するために使用されるデータポイントを実際の値に凝縮できます。つまり、トレーニングデータには、、、代わりにの形式の新しい値があり、各独立変数にそれぞれの係数が乗算されます。この単純化されたバージョンは、次のように単純な回帰として視覚的に表示できます。x x 1 x 2 x 3バツバツ1バツ2バツ3

    ここに画像の説明を入力してください

このトピックに関する適切な資料を読んでいるにもかかわらず、私はこれについて混乱しています。誰かが多重線形回帰モデルを「説明する」方法と視覚的にそれを表示する方法を私に説明してもらえますか。


2
あなたの文書の目的は何ですか?また、聴衆は誰ですか?同様の記事を入手することから始めて、自分の分野でどのように行われるかについていくつかの例を探します。私は生物医学文献に精通しており、ほとんどの場合、テーブルを使用しています。作者が相互作用を説明しようとすると、イラストがより頻繁に見られます。
Penguin_Knight

@Penguin_Knight、これはコンピューターサイエンスドメインですが、これは特定のドメインに限定されるのではなく、一般的なものだと思います。私が間違っている場合は修正してください。
クリス14年

うーん...しかし質問。私にとって唯一の一般的な部分は、必要以上に表示しないで、強調するコンポーネントが本当に強調されるようにすることです。私の分野だけでも、3つのオプションすべてを見てきました。1)結果を表にするのが最も一般的で、3)が続きますが、ほとんどは予測結果をプロットする形式で、2)です。しかし、2)のために、私が提案し@gregory_britten何を使用したい:代わりに、個々のXの使用を調整X
Penguin_Knight

分布プロットを使用します。...モデルから得られる近似値の分布を見て、それを実際の値の分布と比較します。
オワイスクレシ1

私はこれが何年も前のものであることを知っていますが、ここに再度アクセスすると、データを投稿できますか?そうすれば、人々はさまざまな可能性を示すために協力することができます。
グン-モニカの復職

回答:


21

バツY/sdバツ。このように、係数のゼロからの距離は、相対的な「重要度」をランク付けし、CIは精度を与えます。私はそれが関係をかなりうまくまとめており、自然でしばしば異なる数値スケールの係数とp値よりもはるかに多くの情報を提供すると思います。以下に例を示します。

ここに画像の説明を入力してください

YバツYバツ1+バツ2+バツ3バツYavPlots()carlm

ここに画像の説明を入力してください


この情報をありがとう@gregory_britten。手元にある問題には8つの独立変数があります。「追加された変数プロット」は、多数の入力変数に対して妥当だと思いますか?
クリス14年

最初のプロットのアイデアに沿って、Rで作業している場合、これらすべてを簡単にするRMSパッケージを検討することをお勧めします。良い点は、共分散の意味のある段階的な変更を要求できるため、標準化の必要性を回避できることです。
トーマスシュパイデル14年

@suzanneはい、間違いなく。追加された変数プロットは、任意の数の変数の2次元の視点を提供します。特に高次元で明らかになります。一つは、多くの場合、観測されたY.内のすべての明白ではなかった残差で暴露のパターンを発見する
gregory_britten

それは確率に関してで使用されている方法を知っているこのcontext.IでX2&X3表記が、私はかなりそれがここで言っているのか理解することはできません|私はかなりX1を理解していない
Casebash

1
@CasebashこれはX1上の偏回帰、所与X2及びX3は、モデルにされている
gregory_britten

1

それらはすべて、肝硬変の原因を説明することに関係しているので、バブル/サークルチャートを試し、色を使用して異なる回帰変数と円の半径を示して、肝硬変に対する相対的な影響を示しましたか?

ここでは、次のようなGoogleチャートタイプを参照しています。ここに画像の説明を入力してください

そして、無関係な注意として、あなたのプロットを間違って読んでいない限り、あなたはそこにいくつかの冗長なリグレッサーを持っていると思います。ワインはすでに酒であるため、これら2つが別々の回帰変数である場合、肝硬変の発生率を説明することが目標であれば、両方を保持することは意味がありません。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.