ノモグラムの読み取りに関する説明


10

以下は、式のrmsパッケージを使用してmtcarsデータセットから作成されたノモグラムです。

mpg ~ wt + am + qsec

ここに画像の説明を入力してください

モデル自体は0.82のR2とP <0.00001で良いようです

> mod

Linear Regression Model

ols(formula = mpg ~ wt + am + qsec, data = mtcars)

                Model Likelihood     Discrimination    
                   Ratio Test           Indexes        
Obs       32    LR chi2     60.64    R2       0.850    
sigma 2.4588    d.f.            3    R2 adj   0.834    
d.f.      28    Pr(> chi2) 0.0000    g        6.456    

Residuals

    Min      1Q  Median      3Q     Max 
-3.4811 -1.5555 -0.7257  1.4110  4.6610 

          Coef    S.E.   t     Pr(>|t|)
Intercept  9.6178 6.9596  1.38 0.1779  
wt        -3.9165 0.7112 -5.51 <0.0001 
am         2.9358 1.4109  2.08 0.0467  
qsec       1.2259 0.2887  4.25 0.0002  

これらの「ポイント」、「合計ポイント」、「線形予測子」が何であるかはわかりません。これらのどれが結果変数であるmpgを表しますか?説明をいただければ幸いです。

編集:ポイントなどを簡単に読み取るための@Glen_bによる優れた提案を検討すると、代替のノモグラムになります:

ここに画像の説明を入力してください

結果変数または応答変数を使用できるため、「線形予測子」という用語の代わりに使用できます。また、ノモグラムをどのように読み取る必要があるかについても自明です。


そこに編集された素敵な図
Glen_b-モニカの復活2015

回答:


11

さて、モデルは線形であり、予想されるmpgは線形予測子に等しいので、線形予測子スケールからmpgを直接読み取ることができます。

各変数について、関連するスケールでその値を見つけます。たとえば、次の車の予測されたmpgを見つけたいとしますwt=4, am=1, qsec=18

ここに画像の説明を入力してください

予測されるmpgは約18.94になります。方程式に代入すると18.95となるので、かなり近いです。(実際には、おそらく最も近い整数点までしか作業しないでしょう。そのため、ここでは3〜4桁ではなく、約2桁の精度-"19 mpg"-が得られます。)

このような図の主な利点の1つは、さまざまな予測変数(IV)の変化が応答(DV)に及ぼす相対的な影響を即座に確認できることです。計算にダイアグラムが必要ない場合でも、変数の相対的な影響を単純に表示するという点で大きな価値があります。


コメントからのフォローアップ質問:

非線形回帰または多項式回帰に対して同じように機能しますか?

場合について、おそらく明らか- -いくつかの予測子、多少非線形である修飾が必要とされています。があると想像してくださいY = B 0 + B X 1つの + F X 2E(Y)y^=b0+bx1+f(x2)

ここで:

(a)は単調です。またはf

(b)は単調ではないf

どちらの場合も、のスケールは上記とまったく同じように機能しますが、x1

(a)のスケールは線形ではありません。たとえば、が単調減少しているが(ほぼ)2次である場合、次のようなものになる可能性があります。 fx2f

ここに画像の説明を入力してください

(b)非単調スケールは、分岐点で「壊れ」、反転します。例えばx2

ここに画像の説明を入力してください

-ここでは、関数はあたりのどこかに最小値を持っていますx = 2.23f(x)x=2.23

そのような関数には、スケールが複数回壊れたり反転したりする複数のターニングポイントがある可能性がありますが、軸線には2つの側面しかありません。

ポイントタイプのノモグラムでは、オーバーラップが発生しなくなるまで、追加のスケールセクションを少し上下に(より一般的には、軸の方向に直角に)移動できるため、これは問題になりません。

(配置タイプのノモグラムでは複数のターニングポイントが問題になる可能性があります。ハレルの本に示されている1つの解決策は、値の位置が実際に取られる参照線からすべてのスケールをわずかにオフセットすることです。)


非線形リンク関数を持つGLMの場合、スケールは上記のように機能しますが、線形予測子のスケールは、上記の(a)のような非線形スケールでマークされます。Y

これらすべての状況の例は、ハレルの回帰モデリング戦略にあります。



ほんの数個の付記

  1. 関連するセクションの上部と下部に2つのポイントスケールを表示することをお勧めします。それ以外の場合、「垂直」とは何かを推測する必要があるため、正確に「整列」することは困難です。このようなもの:

    ここに画像の説明を入力してください

    ただし、コメントで述べたように、図の最後のセクション(合計ポイントと線形予測子)の場合、2番目のポイントスケールのより良い代替案は、単純に2つの連続したスケール(1つのポイントの合計ポイント)を使用することです。側、もう一方の線形予測子)、このように:

    ここに画像の説明を入力してください

    その結果、「垂直」とは何かを知る必要がなくなります。

  2. 2つの連続予測子と1つのバイナリファクターだけで、従来の線形ノモグラムを簡単に作成できます。

    ここに画像の説明を入力してください

    この場合、あなたは単に見つけるwtqsecそのスケール上の値を、ラインでそれらを結合します。mpg軸と交差する場所で値を読み取ります(am変数mpgが読み取る軸のどちら側かを決定します)。このような単純なケースでは、これらの種類のノモグラムはより高速で簡単に使用できますが、扱いにくくなる可能性がある多くの予測子に一般化するのは簡単ではありません。質問のポイントスタイルのノモグラム(回帰モデリング戦略rmsR のパッケージに実装されている)は、より多くの変数をシームレスに追加できます。これは、相互作用を処理するときに非常に有利です。


明確で図解された説明をありがとう。非線形回帰または多項式回帰に対して同じように機能しますか?
rnso

1
この追加の質問に回答するために、回答を編集しました。
Glen_b-2015

2
これは素晴らしいポストグレンです。nomogram関数のplotメソッドを変更して、Pointsデフォルトで追加のスケールを追加すると思います。素晴らしい提案!!
フランクハレル

1
@FrankHarrellいいえ、ポイントと合計ポイントの関係を読み取らないため、同じページにある必要はありません。問題は、「垂直」を見つけることです。これにより、合計点から線形予測子まで正確に読み取ることができます。これらの2つの目盛りが2インチ離れていると言うのではなく、非常に近いか、または接触している場合は、問題ありません。それらが数インチ離れている場合、垂直方向を見つける際の数度のエラーは、結果にかなりのエラーを意味する可能性があります。ただし、最初のセクションには2つのポイントスケールが必要です。これは、多数の予測子を使用でき、それらすべてがポイントスケールに隣接することができないためです。
Glen_b-2015

1
@FrankHarrell個人的には、グリッドが表示を乱雑にし、その値を不明瞭にする傾向があると思います。できればグリッドは避けます。グリッドがスケールと同じくらい細かい場合を除いて、垂直になるのと同じ程度の精度は許可されません(視覚的にはひどいと思います)。オプションがないと、2番目のポイントスケールで編集することになります。 (ここで行ったのと同じように)2つの目的で使用可能な状態として表示されるようにする(つまり、予測された値をかなり正確に推定するii。相対的な寄与を明確にする)応答への応答)..
Glen_b-モニカ
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.