統計モデルが「識別」されているかどうかはどうすればわかりますか?


7

私の計量経済学の教授は、クラスで「識別された」という用語を使用しました。フォームのデータ生成プロセスを検討しています

Y=β0+β1X+U
どこ X 確率変数であり、 Uランダムなエラー項です。私たちの回帰直線は、
Y=β0^+β1^X

彼は「識別された」の次の定義を与えた:

β0β1されている識別データセットならば{Xn}i=1 固有の値を「固定」するのに十分な情報が含まれています β0β1

彼は「情報」とは何か、また「ピン留め」が何を意味するのかを彼が指定していないので、私はこの定義に不満です。

コンテキストのビット

私たちの演習の1つで、 E[UX]=α0。私の教授によると、これはモデルを「識別可能」にするために必要な「外因性」と呼ばれる仮定に違反しています。

具体的には、彼の講義ノートによると、

外因性の仮定:エラー項はリグレッサと無相関です、またはCov(Un,Xnk)=0 すべてのために k=1,2,3...,K。の仮定によってE(Un|Xn1,Xn2,...,XnK)、これは次のように書き直すことができます

Cov(Un,Xnk)=E(UnXnk)=0
すべてのために k=1,2,3...,K

それは私たちの問題のようです、彼はこの外因性の仮定が失敗した場合、モデルを特定できない理由を理解させようとしています。うまくいけば、これは彼がその用語をどのように使用しているかについての回答者にコンテキストを与えることができます。

私の質問

誰かが彼が「情報」と「ピン留め」によって何を意味するのかを明確にすることができますか?または、より良い定義をまとめて与えます。

編集:

ウィキペディアから抜粋:

観測的に同等--- 2つのパラメーター値の両方が観測可能なデータの同じ確率分布になる場合、観測的に同等と見なされます。

識別済み---統計モデルに同じ観測値の分布を生成する複数のパラメーターセットが常に存在する状況。つまり、複数のパラメーター化が観測的に同等であることを意味します。

これはまだ「外因性」がどこにやって来るのか、なぜそれが「識別される」ことに関連しているのかを実際には説明していません。


あいにくあいまいな定義です。ウィキペディアが救いに?
シャドウトーカー2016


@ssdecontrol定義を追加しましたが、それで本当に十分かどうかはわかりません。それはより定性的な声明です。私はもう少しマットなものを好みます。
Stan Shunpike

ウィキペディアが提供する需要と供給のモデルは、あなたが何を求めているのかを正確に示しています
shadowtalker

間違ったページをリンクしたようですが、Google検索に関するすべての標準コメントがここに適用されます:1)en.m.wikipedia.org/wiki/Identifiability、2en.m.wikipedia.org/wiki/Parameter_identification_problem
shadowtalker

回答:


3

識別可能性とは、基本的に、モデルのパラメーターに対して一貫した推定量が存在するかどうかを指します。言い換えると、データの分布が通知された場合、モデルパラメータを回復できますか?そうでない場合、モデルは識別できません。

おそらく、識別できないモデルの最も単純な例は、パラメーターが多すぎるANOVAモデルです。このモデルは次の形式を取ります

Yij=μ+αi+ϵij

どこ μ そして {αi}i=1k 任意の定数であり、 ϵij 正常(0,σ2)。その情報が与えられた場合Yij 正常(μi,σ2) 一部の定数セット {μi}i=1k そして σ2、そしてこれがデータから学ぶことができるすべてのことであり、これを定数に変換するユニークな方法がないことに注意することが重要です μ{αi}i=1k そして σ2。これは、いつでもμ+c そして αic 同じ平均パラメーターに到達する μi=μ+αiモデルパラメータのさまざまな値。無限のデータがあっても、これらの値を回復することはできません。このため、制約を課しますi=1kαi=0 モデルと分布パラメーター間の1対1のマッピングを保証します。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.