問題は、(XとYの)限界効果についてです。個々の係数の解釈についてはそれほどではありません。人々が有益に指摘しているように、これらは、たとえば線形関係と加法関係がある場合にのみ、効果サイズで識別できる場合があります。
それが焦点である場合、問題について考える(概念的には、実際的ではないにしても)最も単純な方法は次のようになります。
なしの相互作用を持つ線形通常回帰モデルでY上のXの限界効果を得るには、できるだけのことは知られていないと推定されているので、非常に十分ではありませんX.しかし、上の係数を見てください。いずれにせよ、限界効果に本当に必要なのは、Xの値の範囲に対するYに関する予測と不確実性の尺度を提供するある種のプロットまたは要約です。通常、予測平均Yと信頼区間が必要な場合がありますが、XのYの完全な条件付き分布の予測も必要な場合があります。その分布は、モデル係数に関する不確実性を考慮しているため、近似モデルのシグマ推定よりも広くなります。 。
このような単純なモデルには、さまざまな閉じた形のソリューションがあります。現在の目的では、それらを無視し、代わりに、任意の複雑なモデルを扱う方法で、シミュレーションによって限界効果グラフを取得する方法についてより一般的に考えることができます。
Yの平均値に対するXの変化の影響が必要であり、他のすべての変数をいくつかの意味のある値に修正するとします。Xの新しい値ごとに、モデル係数の分布からサイズBのサンプルを取得します。Rでこれを行う簡単な方法は、それが平均coef(model)
と共分散行列をもつNormalであると仮定することですvcov(model)
。係数の各セットに対して新しい期待Yを計算し、間隔でロットを要約します。次に、Xの次の値に移動します。
この方法は、各サンプリングステップで変数(またはその逆)も適用する場合、変数に適用されるファンシーな変換の影響を受けないように思えます。そのため、近似モデルに予測子としてlog(X)がある場合は、新しいXをログに記録してから、サンプリングした係数を掛けます。近似モデルが従属変数としてsqrt(Y)を持っている場合、サンプルで予測された各平均値を二乗してから、それらを区間として要約します。
要するに、プログラミングは増えるが確率計算は少なくなり、結果として臨床的に理解可能な限界効果が得られる。この「方法」は、政治学の文献ではCLARIFYと呼ばれることもありますが、非常に一般的です。