順序独立変数を持つ連続従属変数


17

連続従属変数yおよび順序変数X 1を含む独立変数が与えられた場合、線形モデルをどのように当てはめRますか?このタイプのモデルに関する論文はありますか?

回答:


29

@Scortchi は、順序付けられた共変量のCodingについてのこの答えであなたをカバーしました調査の回答に対する2つの人口統計学的IVの効果(リケルトスケール)への回答について、推奨事項を繰り返しました。具体的には、Gertheissの(2013) ordPensパッケージを使用すること、および理論的背景とシミュレーション研究についてはGertheiss and Tutz (2009a)を参照することをお勧めします。

おそらく必要な特定の関数はordSmooth*です。これにより、順序変数のレベル全体でダミー係数が基本的に平滑化され、隣接するランクのダミー係数との差が小さくなるため、過剰適合が減少し、予測が改善されます。通常、データが実際に順序付けられている場合、連続(またはその用語では、メトリック)データの回帰モデルの推定(最尤法(この場合は通常の最小二乗))と同様に、または(場合によっては)はるかに優れています。あらゆる種類の一般化線形モデルと互換性があり、名目上の予測子と連続予測子を別々の行列として入力できます。

Gertheiss、Tutz、および同僚からのいくつかの追加の参照が利用可能であり、以下にリストされています。これらの一部には代替案が含まれる可能性があります。Gertheissand Tutz (2009a)でさえ、別の代替案として尾根の再処理について議論しています。私はまだすべてを掘り下げていませんが、序数の予測因子に関する文献が少なすぎるという@Erikの問題を解決できると言えば十分です。

参照資料

-Gertheiss、J.(2013年6月14日)。ordPens:順序予測子の選択および/または平滑化、バージョン0.2-1。http://cran.r-project.org/web/packages/ordPens/ordPens.pdfから取得。
-Gertheiss、J.、Hogger、S.、Oberhauser、C。、およびTutz、G。(2011年)。機能するコアセットの国際分類への応用を伴う、通常スケーリングされた独立変数の選択。Journal of the Royal Statistical Society:シリーズC(応用統計)、60(3)、377–395。
-Gertheiss、J.&Tutz、G.(2009a)。順序予測子によるペナルティ回帰。国際統計レビュー、77(3)、345–365。より作成http://epub.ub.uni-muenchen.de/2100/1/tr015.pdf
-Gertheiss、J。、およびTutz、G。(2009b)。ブロックワイズブースティングによる質量分析ベースのプロテオームプロファイリングでの教師付き機能選択。バイオインフォマティクス、25(8)、1076〜1077。
-Gertheiss、J。、およびTutz、G。(2009c)。可変スケーリングおよび最近傍法。Journal of Chemometrics、23(3)、149–151。-Gertheiss、J.&Tutz、G.(2010)。カテゴリーの説明変数のスパースモデリング。 応用統計年報、4、2150〜2180。
-Hofner、B.、Hothorn、T.、Kneib、T。、およびSchmid、M。(2011)。ブースティングに基づく公平なモデル選択のためのフレームワーク。Journal of Computational and Graphical Statistics、20(4)、956–971。http://epub.ub.uni-muenchen.de/11243/1/TR072.pdfから取得。
-Oelker、M.-R.、Gertheiss、J.、&Tutz、G.(2012)。一般化線形モデルでのカテゴリー予測子および効果修飾子による正則化およびモデル選択。統計局:テクニカルレポート、No。122http://epub.ub.uni-muenchen.de/13082/1/tr.gvcm.cat.pdfから取得。
-Oelker、M.-R.、&Tutz、G.(2013)。一般化された構造化モデルで異なるタイプのペナルティを組み合わせるための一般的なペナルティファミリ。統計局:テクニカルレポート、No。139http://epub.ub.uni-muenchen.de/17664/1/tr.pirls.pdfから取得。
-Petry、S.、Flexeder、C。、およびTutz、G。(2011年)。ペアワイズ融合投げ縄。統計局:テクニカルレポート、No。102http://epub.ub.uni-muenchen.de/12164/1/petry_etal_TR102_2011.pdfから取得。
-ルフィバッハ、K。(2010)。順序付き予測子を使用した一般化線形モデルのパラメーターを推定するアクティブセットアルゴリズム。計算統計とデータ分析、54(6)、1442–1456。http://arxiv.org/pdf/0902.0240.pdf?origin=publication_detailから取得。
-Tutz、G.(2011年10月)。カテゴリデータの正則化方法。ミュンヘン:ルートヴィヒマクシミリアン大学 http://m.wu.ac.at/it/departments/statmath/resseminar/talktutz.pdfから取得。
-Tutz、G。、およびGertheiss、J。(2013)。評価は予測子としてスケールする-スケールレベルの古い質問といくつかの答え。サイコメトリカ、1-20。


15

複数の予測子があり、関心のある予測子が順序的である場合、変数のコーディング方法を決定するのが難しいことがよくあります。カテゴリとしてコーディングすると順序情報が失われますが、数値としてコーディングすると、順序付けられたカテゴリの効果に直線性が課せられますが、実際の効果とはほど遠い場合があります。前者については、非単調性に対処する方法として等張回帰が提案されていますが、それは他の多くのデータ駆動型手順と同様に、最終適合モデルと有意性の注意深い評価を必要とするデータ駆動型モデル選択手順ですそのパラメータの。後者の場合、スプラインは厳密な線形性の仮定を部分的に緩和する可能性がありますが、順序付けされたカテゴリに番号を割り当てる必要があり、結果はこれらの選択に敏感です。私たちの論文(Li and Shepherd、2010、Introduction、パラグラフ3-5)では、

してみましょう結果変数で、関心の序予測因子であること、および他の共変量なります。私たちは、のために1〜2つの回帰モデルにフィットするように提案した上や他の上、二つのモデルの残差を計算し、残差との相関関係を評価します。Li and Shepherd(2010)では、が序数の場合にこのアプローチを研究し、カテゴリの効果が単調である限り、非常に優れたロバストアプローチになり得ることを示しました。現在、他の結果タイプに対するこのアプローチのパフォーマンスを評価しています。X Z Y Z X Z Y XYXZYZXZYX

このアプローチは、順序の回帰の適切な残存必要に。Li and Shepherd(2010)の順序結果の新しい残差を提案し、それを使用して検定統計量を構築しました。さらに、この残留物の特性とその他の用途を別の論文で研究しました(Li and Shepherd、2012)。ZXZ

RパッケージPResidualsを開発しました。これはCRANから入手できます。パッケージには、線形および順序の結果タイプのアプローチを実行するための関数が含まれています。他の結果タイプ(例:カウント)と機能(例:相互作用の許可)の追加に取り組んでいます。このパッケージには、さまざまな回帰モデルの確率スケール残差である残差を計算するための関数も含まれています。

参照資料

Li、C.&Shepherd、BE(2010)。共変量の調整中の2つの順序変数間の関連性のテスト。JASA、105、612–620。

Li、C.&Shepherd、BE(2012)。通常の結果の新しい残差。Biometrika 99、473〜480。


7

一般的に、従属変数としての順序変数に関する多くの文献があり、それらを予測変数として使用することはほとんどありません。統計的実践では、通常、連続的またはカテゴリー的であると想定されます。残差をチェックすることにより、連続変数としての予測子を持つ線形モデルが適切に見えるかどうかを確認できます。

累積的にコーディングされることもあります。たとえば、レベル1、2、および3の順序変数x1の場合、x1> 1の場合はダミーのバイナリ変数d1、x1> 2の場合はダミーのバイナリ変数d2があります。d1の係数は、2から3の序数を増やしたときに得られる効果です。d2の係数は、2から3の序数で得た効果です。

これにより、多くの場合、解釈がより簡単になりますが、実際の目的でカテゴリ変数として使用するのと同等です。

ゲルマンは、モデルの柔軟性を高めるために、カテゴリカルファクター(主な効果の場合)および連続変数(相互作用の場合)の両方として順序予測子を使用することも示唆しています。

私の個人的な戦略は、通常、それらを連続として扱うのが理にかなっていて、合理的なモデルで結果が出るかどうかを調べ、必要な場合にのみカテゴリーとして使用することです。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.