Rの「前の状態」が「後の状態」に影響を与えるかどうかをテストする方法


10

状況を想像してみてください。3つの鉱山の歴史的な記録(20年)があります。銀の存在は来年金を見つける確率を高めますか?そのような質問をテストする方法は?


ここに画像の説明を入力してください

以下はデータの例です。

mine_A <- c("silver","rock","gold","gold","gold","gold","gold",
            "rock","rock","rock","rock","silver","rock","rock",
            "rock","rock","rock","silver","rock","rock")
mine_B <- c("rock","rock","rock","rock","silver","rock","rock",
            "silver","gold","gold","gold","gold","gold","rock",
            "silver","rock","rock","rock","rock","rock")
mine_C <- c("rock","rock","silver","rock","rock","rock","rock",
            "rock","silver","rock","rock","rock","rock","silver",
            "gold","gold","gold","gold","gold","gold")
time <- seq(from = 1, to = 20, by = 1)


1
遷移行列の計算に興味があるかもしれません。
アンディW

こんにちは@AndyW!コメントありがとうございます。私は遷移行列パッケージに精通しています:makkovchain-markovchainFit()。遷移行列の確率値をp値として使用できますか?「銀と金の関係」という仮説を検証する方法はありますか?(p値= xx)?
LadislavNaďo2015

1
@LadislavNado遷移確率はp値として解釈できません(H0の拒否については何も通知されません)。p値の詳細については、stats.stackexchange.com / questions / 31 /…を参照してください。
Tim

1
データの抽出方法に問題があるようです。「シルバー:いいえ」と「ゴールド:はい」のシナリオを考えてみます。「ゴールド」の連続実行もカウントする必要があります。これは、ロジック基準を満たしているためです。

1
1つのセルを1から14に修正すると、モデルは次のように変わります。エラーz値Pr(> | z |)(切片)-1.2528 0.8018 -1.562 0.118 as.factor(c(0、1))1 0.3655 0.8624 0.424 0.672

回答:


4

私の最善の努力: ... @AndyWによって提案された遷移行列の使用は、おそらく私が探している解決策ではありません(@Timのコメントに基づく)。だから私は別のアプローチを試しました。応答変数yと予測子変数xの両方がバイナリであるロジスティック回帰を行う方法を扱うこのリンクを見つけました。

例によれば、データに基づいて2×2のテーブルを作成する必要があります。

               gold (yes)  gold (no)
silver (yes)       2           7
silver (no)       14          34

値を抽出する方法: ここに画像の説明を入力してください

そしてモデルを構築します:

response <- cbind(yes = c(2, 14), no = c(7, 34))

mine.logistic <- glm(response ~ as.factor(c(0,1)),
                      family = binomial(link=logit))

summary(mine.logistic)
# Coefficients:
#                     Estimate Std. Error z value Pr(>|z|)
# (Intercept)          -1.2528     0.8018  -1.562    0.118
# as.factor(c(0, 1))1   0.3655     0.8624   0.424    0.672

それは良い解決策ですか?p値(0.673)は、銀の存在が金を見つける確率を増加させないことを意味しますか?


どのようにしてこれらの素晴らしいチャートを生成しましたか?ティクズ?
シャドウトーカー2015

こんにちは@ssdecontrol!チャートはInkscapeで手動で作成されました。
LadislavNaďo2015

はい、それはまともな解釈です。また、2x2テーブルの行だけを見ると、一番上の行(シルバー:あり)には9つのケースがあり、そのうち2つに金が含まれていたため、来年のシルバーの金の確率は2/9 = 0.222です。下の行(銀:いいえ)には48のケースがあり、そのうちの14は来年金を持っているため、銀の銀の確率がないとすると、14 /(14 + 34)= 0.292になります。これらすべてを考慮すると、p値からは「統計的に有意」ではないものの、銀は金を見つける可能性を損なうように見えます。
Gregor Thomas

また、コーディングにも注意してくださいyes = c(2, 14), no = c(7, 34)。最初にを使用します。つまり、Silver:yesを最初に配置します。ですからas.factor(c(0, 1))、0はシルバーに対応します:はい、これはあなたの参照レベルであり、したがってあなたの切片です。0.67のp値は、金が銀:はいから銀:いいえに移動する確率を見つけるときに得られる小さな正のバンプに対応します。
Gregor Thomas

一つの最後のコメント:あなたがしている遷移行列を使用しました。2、7、14、34行列は遷移行列です。
Gregor Thomas
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.