統計モデルの非線形性の基準と意思決定とは何ですか?


10

次の一般的な質問が意味をなすことを願っています。この特定の質問の目的のために、非線形性を導入するための理論的な(対象ドメイン)理由には興味がないことに注意してください。したがって、質問全体を次のように定式化します。

理論的(対象領域)以外の理由で統計モデルに非線形性を導入するための論理的なフレームワーク基準、および可能であれば意思決定プロセス)とは何ですか? いつものように、関連するリソースやリファレンスも歓迎します。

回答:


7

モデル構築プロセスでは、モデルビルダーが多くの決定を行います。決定の1つは、調査するモデルの異なるクラスから選択することです。検討できるモデルのクラスはたくさんあります。たとえば、いくつか例を挙げると、ARIMAモデル、ARDLモデル、Multiple Source of Error State-Spaceモデル、LSTARモデル、Min-Maxモデルなどです。もちろん、一部のモデルのクラスは他のクラスよりも広く、一部のモデルのクラスが他のモデルのサブクラスであることを見つけるのは一般的ではありません。

質問の性質を考えると、主に2つのクラスのモデルにのみ焦点を当てることができます。線形モデル非線形モデル

上記の図を念頭に置いて、非線形モデルを採用することが有用な時期と、それを行うための論理フレームワークがあるかどうか、つまり統計的および方法論的な観点から、OPsの質問に取り組みます。

最初に気付くことは、線形モデルが非線形モデルの小さなサブクラスであることです。つまり、線形モデルは非線形モデルの特殊なケースです。そのステートメントにはいくつかの例外がありますが、現在の目的では、問題を簡略化するためにそれを受け入れることで多くを失うことはありません。

通常、モデルビルダーはモデルのクラスを選択し、いくつかの方法論を使用して、その特定のクラス内からモデルを選択します。簡単な例は、時系列をARIMAプロセスとしてモデル化し、Box-Jenkins手法に従ってARIMAモデルのクラスからモデルを選択する場合です。この方法で、モデルのファミリに関連付けられた方法で作業することは、実際に必要なことです。

非線形モデルを構築することを決定した結果は、より小さな線形モデルのセットから選択する場合と比較すると、モデル選択の問題がはるかに大きくなる(より多くのモデルを検討し、より多くの決定に直面する必要がある)ため、実際のモデルは手元に実用的な問題。さらに、非線形モデルのいくつかのファミリから選択するために使用する完全に開発された方法論(既知、受け入れられ、理解され、伝達が容易)さえない場合があります。さらに、非線形モデルを構築することのもう1つの欠点は、線形モデルが使いやすく、その確率的特性がよく知られていることです(Teräsvirta、Tjøstheim、およびGranger(2010))。

とはいえ、OPは、実用的またはドメイン理論的な決定ではなく、決定を導くための統計的根拠を求めているので、私は続けなければなりません。

処理する非線形モデルの選択方法を検討する前に、代わりに、まず線形モデルと非線形モデルのどちらを処理するかを決定する必要があります。決定!この選択方法は?

GrangerとTerasvirta(1993)にアピールすることで、次の2つの質問に対する2つの主要なポイントを持つ次の議論を採用します。

Q:非線形モデルを作成すると便利なのはいつですか?要するに、線形モデルのクラスがすでに検討されており、検査中の関係を特徴付けるのに不十分であると見なされている場合、非線形モデルを構築することが有用な場合があります。この非線形モデリング手順(意思決定プロセス)は、線形から非線形に進むという意味で、単純なものから一般的なものに至ると言えます。

Q:非線形モデルの構築を正当化するために使用できる統計的根拠はありますか?線形性テストの結果に基づいて非線形モデルを構築することを決定した場合、そうだと思います。線形性テストで関係に有意な非線形性がないことが示唆された場合、非線形モデルの構築は推奨されません。テストは、ビルドする決定の前に行う必要があります。

Granger and Terasvirta(1993)を直接参照して、これらのポイントを具体化します。

非線形モデルを構築する前に、実際に線形モデルが分析中の[経済]関係を適切に特徴付けるかどうかを確認することをお勧めします。これが事実である場合、合理的なモデルを構築するために利用できる統計理論は、非線形モデルが適切である場合よりも多くなります。さらに、モデルが線形である場合、今後1期間以上の最適な予測を取得する方がはるかに簡単です。少なくとも時系列が短い場合、変数間の真の関係は線形ですが、調査員が非線形モデルを正常に推定することが発生する可能性があります。したがって、モデル構築を不必要に複雑にする危険性は現実的ですが、線形性テストによって軽減することができます。

最近の著書、Teräsvirta、Tjøstheim、およびGranger(2010)では、同じ種類のアドバイスが提供されています。

実用的な観点から、より複雑な非線形モデルの推定を試みる前に線形性をテストすることは有用です。多くの場合、統計的な観点からもテストが必要です。多くの一般的な非線形モデルは、線形性の下では識別されません。データを生成した真のモデルが線形であり、非線形モデルがこの線形モデルをネストしている場合、非線形モデルのパラメーターを一貫して推定することはできません。したがって、線形性のテストは、非線形のモデリングと推定に先行する必要があります。

例で終わりましょう。

ビジネスサイクルのモデル化のコンテキストでは、統計的根拠を使用して非線形モデルの構築を正当化する実際的な例は次のようになります。線形単変量モデルまたはベクトル自己回帰モデルは非対称循環時系列を生成できないため、データの非対称性を処理できる非線形モデリングアプローチを検討する価値があります。データの可逆性に関するこの例の拡張バージョンは、Tong(1993)にあります。

時系列モデルに集中しすぎた場合はお詫びします。ただし、一部のアイデアは他の設定にも適用できると確信しています。


2
グレイム、あなたの答えは素晴らしいです、そして他の答えも同様に素晴らしいですが、あなたの答えは私が探していたものに近いです(もしそうなら、ミニバージョン)。+1して受け入れました。回答の準備にご尽力いただき、誠にありがとうございます。参考文献だけでなく、複数回レビューすることを確信しています。ハレル博士の回帰戦略に関する本には、私が理想的に持っているフレームワークの一部も含まれていると思います。ちなみに、私のテーマ別統計フレームワークのアイデアは、Lisa Harlowの優れた著書「多変量思考のエッセンス」に触発されたものです。
Aleksandr Blekh、2015年

12

包括的な問題は、どのタイプの問題に対して線形性が期待されるかを決定することです。そうでない場合、サンプルサイズが許す限り、関係を非線形にすることができます。生物学、社会科学、その他の分野のほとんどのプロセスは非線形です。線形関係を期待する唯一の状況は次のとおりです。

  1. ニュートン力学
  2. 予測YY

Y

大規模なデータセットでは、どこでも線形である関係はめったにありません。

非線形性を回帰モデルに含めるかどうかの決定は、グローバルな統計的原則からではなく、むしろ世界の仕組みから来ています。1つの例外は、次善の統計フレームワークが選択されており、フレームワークの不適切な選択を埋め合わせるために非線形性または相互作用項を導入する必要がある場合です。相互作用の項は、モデル化不足(たとえば、線形性を想定すること)による主効果を相殺するために必要になる場合があります。他の主な影響のモデル化不足から生じる情報の損失を相殺するには、より多くの主な影響が必要になる場合があります。

研究者は、線形に作用するように強制することにより、他の多くの変数を過小評価している間に特定の変数を含めるかどうか悩むことがあります。私の経験では、線形性の仮定は、重要なすべての仮定の中で最も違反の多いものの1つです。


2
+1ハレル博士、貴重な答えをありがとう。要点を理解しました。ただし、統計理論さまざまな問題(統計、データ、方法などを含む)のために研究者またはデータサイエンティストが追加の非線形コンポーネントを導入しなければならない(そしてそれが実際に私の質問の本質だった)状況にも興味があります。 。)、主題ドメイン理論ではありません。これについてのあなたの洞察をいただければ幸いです。
Aleksandr Blekh 2015年

5
線形性は、プロセスよりもデータに依存します。ほとんどのフィールドのほとんどのプロセスは、十分に狭い範囲で検討すると線形であり(そのためCalculusが非常に有用です)、十分に広い範囲で非線形です(機械的プロセスを含む)。十分な大きさのサンプルサイズが利用可能である場合、ほとんどすべてが非線形に見える可能性があることを示唆するのは正しいですが、おそらく問題をフレーム化するより実用的な方法は、線形モデルを採用することが有用である場合を決定する方法に関してでしょう。
whuber

2
@whuber:コメントありがとうございます。非常に便利。今、私は2つの(非)直線性についてよりよく理解の視点理論(対象ドメイン)データ中心。統計的仮定問題(つまり、EDA後)、または同様の側面に起因する追加の非直線性を導入することの統計的および/または方法論的な観点について、私はまだ興味があります。したがって、提案された問題の枠組みに加えて、非線形モデルを採用することが有用な場合の意思決定フレームワークにも興味があります。
Aleksandr Blekh 2015年

1
「ほとんどの分野のほとんどのプロセスは、十分に狭い範囲で検討すると線形であり(そのため、Calculusが非常に有用である理由です)、十分に広い範囲で非線形です」私の目を開く洞察力。@whuber +1博士に感謝します。
ムゲン、2015年

3
@Aleksandr Blekhは、非線形モデルの使用を正当化するための統計的理由(基礎となる理論からの理由とは対照的)を与える統計的検定または残差プロットを探していますか?
ムゲン、2015年

4

yi=α+βxi+εi
yi=α+βxi+γxi2+εi
γは重要ですが、非線形モデルの場合もあります。直観はもちろん、テイラー展開です。線形関数がある場合、一次導関数のみが非ゼロでなければなりません。非線形関数の場合、高次導関数は非ゼロになります。

yi=α+βmax(0,xi)+γmin(0,xi)+εi
γβ

xa=min(x,a)
xa+=max(x,a)
xx=a。異なる地域の同じ変数に複数の勾配を持たせることができます。線形スプラインが重要な場合は、ノットポイントを操作して使用するか、非線形モデルについて考えます。

これは体系的なアプローチではありませんが、私がいつもやっていることの1つにすぎません。


1
+1興味深い洞察。共有していただきありがとうございます。知っておくと便利です。私が(または準備さえ)したいと思っているのは、基本的な推論を伴う類似の(大小の)アプローチの一貫したフレームワーク/ワークフローです。そのようなフレームワークを作成することは、1)実現可能であり、2)他の人々にとって価値があると思いますか?
Aleksandr Blekh 2015年

1
@AleksandrBlekh、私はユニバーサルフレームワークを作成することは不可能だと思います。時系列で最も一般的なのはBox-Jenkinsです。
Aksakal、2015年

4
モデル選択のための統計的テストは、推定、特に標準誤差を歪めます。
フランクハレル2015年

1
yi=β2xi2+εi

2
@ssdecontrol:テイラーシリーズのヒューリスティックの詳細については、Venables(1998)、「線形モデルの例題」、S-Plusユーザー会議、ワシントンDCを参照してください。
Scortchi-モニカの回復
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.