マルコフ連鎖が理論的な連鎖と等しいかどうかをテストする


8

経験的な遷移カウント行列Qがあります。理論的な1次のマルコフ連鎖Pがあります。Nは遷移の数です。QがPと互換性があるかどうかをテストしたいと思います。カイ二乗統計計算する理論的なカウント遷移行列(N * P)、次に自由度の分布のp値を計算します? χ2K*K-1i,jK(Qij(NPij))2NPijχ2K(K1)


2
私はカイ2乗検定についてはあまり詳しくありませんが、ざっと見てみると、多項データ(ここでは例)に一般的に使用されているようです。各行は多項分布に対応していると思いますか?したがって、行にを使用できます。つまり、「からの」遷移の数です。つまり、「」は開始状態によって変わる可能性がありますか?n i i i NPniiiN
GeoMatt22

回答:


5

IPiが=P Iを

Pij=Pr[ji],Qij=t=1N[xt=i&xt+1=j]
i
pi=Pi,:,ni=j=1KQij

「試行回数」は行ごとに異なるため、すべての行をまとめることができるかどうかはわかりません。

たとえば、とすると、データはです。つまり、遷移があり、はからのものですが、はからのみで、はです。したがって、信頼は、一般的に信頼よりも高くなると思います。、X = [ 1 1 2 1 2 3 1 2 ] N = 7 N 1 = 4 、X = 1 、N 2 = 2 、X = 2 N 3 = 1 、X = 3 、P 1 p 3K=3x=[1,1,2,1,2,3,1,2]N=7n1=4x=1n2=2x=2n3=1x=3p^1p^3

(極端な場合、おそらくこの例では、は実際にはでしたが、ように、これらの遷移に関するデータはまったくありません。「証拠の欠如」を「証拠の欠如」として扱うことは、ここでは問題のように思えます。)4 n 4 = 0K4n4=0

私はカイ2乗検定にはあまり詳しくありませんが、これは行を個別に処理することをお勧めします(つまり、合計のみを行い、ではなくを使用します)。この推論はカイ2乗検定に固有のものではないように思われるため、使用する可能性のある他の有意性検定(たとえば、正確な多項式)にも適用する必要があります。n i NjniN

重要な問題は、遷移確率が条件付きであるということです。そのため、各行列エントリには、その前提条件を満たす遷移のみが関連します。実際、おそらく遷移行列はを満たすため、「経験的遷移行列」はなるはずです。jPij=1P、I 、J = Q I J / N IP^ij=Qij/ni


更新: OPによるクエリへの応答として、「テストパラメーター」の説明。

ある場合状態は、マルコフ連鎖で、すなわち、次に行の、対応する多項分布は、確率ベクトルがありますと試行回数。P R K × K I P IR K N INKPRK×KipiRKniN

したがって、カテゴリがあり、確率ベクトルは自由度を持ちます(。そう行の対応する統計量は次のようになり れるであろう漸近ここここで述べたように)自由度で分布したカイ2乗に従います。テストが適切な場合の説明と、より適切な代替テストについては、こちらも参照してください。P I K - 1 Σ K J = 1P I J = 1 iがχ 2 χ 2 iが = Σ J Q 、I jは - N iは、P 、I 、J 2KpiK1j=1K(pi)j=1iχ2、K-1χ2

χi2=j(QijniPij)2niPij
K1χ2

可能と仮定すると、「集中テスト」を行うことが可能持つカイ二乗分布は以下の(IEのDOFを加算自由度の行の上に)。ただし、を独立したものとして扱うことができるかどうかはません。いずれの場合も、行ごとのテストの方が有益であると思われるため、一括テストよりも望ましい場合があります。 K K - 1 χ 2 IχP2=iχi2K(K1)χi2


それを多項分布として扱う賢いアイデア。2つのカイ2乗変数の合計はカイ2乗であるため、各行の検定統計量をコンピューターで個別に計算し、合計して新しいカイ2乗検定統計量を得ることができます。これは自由度になりますNK
Hugh

@ヒュー私は評価するのに十分に精通していませんが、これは非常にまあまあかもしれません。私の主なポイントは、「一括」アプローチよりも「行ごと」アプローチが正当であり、より有益であるように見えるということでした。(副次的なポイントは、多項式のカイ2乗に関するすべての作業、たとえば漸近収束などが良い出発点になる可能性があることです。これらのトピックについて知っているすべては、CVの投稿をスキミングすることから今学んだので、それがすべてです。提供できます!)カイ二乗の側面に直接取り組む短い回答を投稿することを検討してください。
GeoMatt22

@ GeoMatt22 ...では、カイ二乗検定がと等しい自由度の数がdtmcのサイズのNであっても大丈夫ですか?N2N
Giorgio Spedicato 2016

ジョルジョ、私のアップデートを見て。
GeoMatt22 16

@ヒュー私の最新の答えを見てください。ことに注意してくださいウィキペディアは言う、「自由度は観測値の数に基づいていないことに留意すべきです」。「一括テスト」の自由度が正しいかどうかはわかりませんが、自由度がどこから来るのかはわかりません。何か説明はありますか?N KK(K1)NK
GeoMatt22 16
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.