最尤推定のコンテキストでのWald、尤度比、およびラグランジュ乗数検定は、漸近的に同等です。ただし、小さなサンプルの場合、それらはかなり発散する傾向があり、場合によっては、異なる結論が得られます。
ヌルを拒否する可能性に応じて、どのようにランク付けできますか?テストに矛盾する答えがある場合はどうすればよいですか?あなたはあなたが望む答えを与えるものを選ぶことができますか、またはどのように進めるかについての「ルール」または「ガイドライン」がありますか?
最尤推定のコンテキストでのWald、尤度比、およびラグランジュ乗数検定は、漸近的に同等です。ただし、小さなサンプルの場合、それらはかなり発散する傾向があり、場合によっては、異なる結論が得られます。
ヌルを拒否する可能性に応じて、どのようにランク付けできますか?テストに矛盾する答えがある場合はどうすればよいですか?あなたはあなたが望む答えを与えるものを選ぶことができますか、またはどのように進めるかについての「ルール」または「ガイドライン」がありますか?
回答:
私は直接の反応を提供するほど十分にその地域の文学を知りません。ただし、3つのテストが異なる場合、それは、明確に質問に回答するために、さらなる調査/データ収集が必要であることを示しているように思えます。
あなたも見てみたいことがあり、この Googleニュース検索
コメントに応じて更新:
追加のデータを収集できない場合は、回避策が1つあります。データ構造、サンプルサイズ、提案されたモデルを反映するシミュレーションを実行します。パラメータを事前に指定された値に設定できます。生成されたデータを使用してモデルを推定し、3つのテストのうちどれが適切なモデルを示しているかを確認します。このようなシミュレーションは、実際のデータにどのテストを使用するかについてのガイダンスを提供します。それは理にかなっていますか?
3つをランク付けすることに関して、私は決定的な答えを与えません。それぞれに基づいてパラメーターの周囲に95%のCIを構築します。それらが根本的に異なる場合、最初のステップはさらに深く掘り下げることです。データを変換します(ただし、LRは不変です)、尤度を正則化するなど。大まかな議論が続きます。
LRはパラメーター化の選択の下で不変です(たとえば、T対logit(T))。Wald統計は、(T-T0)/ SE(T)の正規性を想定しています。これが失敗した場合、CIは不良です。LRの良い点は、正規性を満たすために変換f(T)を見つける必要がないことです。Tに基づく95%CIは同じになります。また、可能性が2次でない場合、対称であるWald 95%CIは、可能性の高い値よりも可能性の低い値を優先する可能性があるため、奇抜である可能性があります。
LRについて考えるもう1つの方法は、大まかに言えば、尤度関数からより多くの情報を使用することです。Waldは、MLEとヌルでの尤度の曲率に基づいています。スコアは、ヌルでの勾配とヌルでの曲率に基づいています。LRは、ヌルの下での可能性と、ヌルと代替の和集合の下での可能性を評価し、2つを組み合わせます。あなたが1つを選ぶことを余儀なくされている場合、これはLRを選ぶために直感的に満足できるかもしれません。
WaldまたはScoreを選択する理由には、利便性や計算などの他の理由があることに注意してください。Waldは最も単純で、多変量パラメーターを指定して、多数の個別のパラメーターを0に設定するためのテストを行う場合、尤度を概算する便利な方法があります。または、あるセットから一度に変数を追加したい場合は、新しいモデルごとに可能性を最大化したくない場合があります。スコアテストの実装により、ここでいくつかの便利さが提供されます。WaldとScoreは、モデルと可能性が魅力的でなくなると魅力的になります。(しかし、3つすべてが利用可能であるため、これはあなたが質問していたことだとは思わない...)