glm()がリンクスケールの推定値と標準エラーを提供するのはなぜですか?


7

Rでは、誰かが最近ここで私に明らかにしたように、によって推定されたパラメーターglm()とその標準誤差の両方がリンクスケールで提供されます。同じスケールでパラメーターとその標準誤差の両方を提供することは理にかなっていますが、それでは、データの元のスケールで両方を表示してみませんか?ほとんどの人は元のスケールでの見積もりに興味があり、ほとんどの場合それらを逆変換すると思います。この質問へのコメントは、パラメーター推定値とその標準誤差を逆変換する方法に関する質問に対応していますが、そのような推定値が元のスケールではなくリンクスケールの関数によって提供される理由については、まだ知りたくありませんsummary()

回答:


13

確かにはわかりませんが、リンクスケールが役立ついくつかの理由があります。

  • 不確かさの要約として標準誤差を使用することは、パラメーターのドメインが無制限であり、尤度曲面がほぼ二次であるという仮定(パラメータ推定値のサンプリング分布はほぼ正常です)が妥当である可能性が高くなります。たとえば、推定(リンク尺度)1.0および標準誤差3.0のログリンクモデルがあるとします。リンクスケールでは、信頼区間はおよそ1±1.96×。パラメータを逆変換し、パラメータを累乗し、標準誤差に指数パラメータを掛けて(この回答のように)、対称CIを構築しようとすると、次のようになります。2.718±1.96××2.718、負の値を含みます...逆変換したい場合、信頼区間を逆変換する方が理にかなっていますexp1±1.96×
  • おそらくより重要なのは、非常に一般的なロジットリンクの場合、パラメーターをデータスケール(つまり、ロジット/ログ-オッズ-比率から確率)に完全に逆変換することは基本的に不可能です。パラメータを累乗して対数オッズ比からオッズ比スケールに移動することは一般的ですが、ベースライン値を指定せずにオッズ比から確率に戻ることはできません。つまり、一般的に「コントロールと治療に関連するオッズ比はXXXです」と言えますが、コントロールから治療への確率の変化は他の共変量に依存します(たとえば、女性と男性のオッズ比は同じかもしれません)一方、ベースラインリスクは女性と男性で異なるため、確率の変化は異なります。

おそらく最も近い理由は、上記の問題のために、多くの統計モデリングを行うほとんどの人がリンクスケールのパラメーターの解釈に慣れているためです。ほとんどの疫学者と生物統計学者は、オッズ比と対数オッズ比について学ぶことに時間を費やさなければならず、それらの解釈について 書かれた多くの論文があります。良くも悪くも、Rはリンクスケールでパラメーターを解釈することに慣れている人々によって書かれました。ほうきなどの多くのダウンストリームパッケージには、パラメーターとCIを指数化するオプションがあります(ログリンクのデータ(カウント)スケール、ロジットリンクのオッズ比スケール、およびcloglogリンクのハザード比スケール) 。


どうもありがとう。私はあなたの2番目のポイントを理解するために少し時間が必要です(あなたの側からの明確さの欠如のためではありません)。あなたの最初の点に関して、以前の私の同僚がエラー伝搬を研究するためのテイラー展開の使用を私に一度説明したので、それはベルを鳴らします。なぜテイラー展開は実際の標準誤差を与えないのですか?それは、状況固有の仮定に欠ける一般的な方法であるためですか(この場合、SEはカウントデータの場合に正のCIを生成する必要があります)?
マルコプレバニ2018

2
テイラー展開は妥当な標準誤差を与えます(ただし、サンプリング分布がゼロ以外の高いモーメントを持っている場合は正確ではありませんが)主な問題は標準誤差ではなく、標準誤差からCI
ベンボルカー2018

ありがとう。テイラー展開がSEの合理的な推定を生成する理由はまだはっきりしていませんが、それらはCIの不合理な推定につながる可能性があります。さらに、標準的なerorr推定値を取得するためのさまざまな方法をテストし、まったく新しいワームの缶を開きました。私は特別な質問を作成しました:stats.stackexchange.com/questions/355431/…-乾杯
マルコプレバニ

2
極端に歪んだ分布(たとえば、指数分布)を考えます。理論上の平均値と標準偏差は、例えば参照(同一のウィキペディアをだから、下の95%ワルド信頼区間(すなわち、正規の標準偏差/仮定に基づいて1)の下限は常に負である。。
ベンBolker
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.