タグ付けされた質問 「change-point」

配布、プロセス、または機能で変更が発生したことを検出しようとするメソッド。

6
区分的線形関数からデータの変化点を見つける
ご挨拶、 観測された空間のサイズとビッグバンからの経過時間を決定するのに役立つ調査を行っています。うまくいけば、あなたは助けることができます! 2つの線形回帰を実行する区分線形関数に準拠するデータがあります。傾きと切片が変化するポイントがあり、このポイントを見つける(プログラムを作成する)必要があります。 考え?

1
時系列のノイズの多いパッチを強調表示するにはどうすればよいですか?
時系列データがたくさんあります-水位と速度vs時間。これは、水理モデルシミュレーションからの出力です。モデルが期待どおりに動作していることを確認するための確認プロセスの一環として、各時系列をプロットして、データに「ウォブル」がないことを確認する必要があります(以下のマイナーウォブルの例を参照)。モデリングソフトウェアのUIを使用すると、このデータを確認するのにかなり時間がかかり、面倒です。したがって、結果を含むモデルのさまざまなデータをExcelにインポートし、それらをすべて一度にプロットする短いVBAマクロを作成しました。時系列データを分析して疑わしいセクションを強調表示する別の短いVBAマクロを記述したいと思っています。 これまでの私の唯一の考えは、データの勾配について分析を行うことができるということです。特定の検索ウィンドウ内で勾配が正から負に複数回急速に変化する場所は、不安定であると分類できます。もっと簡単なトリックはありませんか?基本的に、「安定した」シミュレーションは非常に滑らかな曲線を提供するはずです。突然の変化は、計算の不安定性の結果である可能性があります。

1
ベイジアンオンラインチェンジポイント検出(マージナル予測分布)
私は、AdamsとMacKayによるベイジアンのオンラインチェンジポイント検出ペーパー(リンク)を読んでいます。 著者は限界予測分布を書くことから始めます: ここでP(xt + 1| バツ1 :t)= ∑rtP(xt + 1|rt,x(r)t)P(rt|x1:t)(1)P(xt+1|x1:t)=∑rtP(xt+1|rt,xt(r))P(rt|x1:t)(1) P(x_{t+1} | \textbf{x}_{1:t}) = \sum_{r_t} P(x_{t+1} | r_t, \textbf{x}_t^{(r)}) P(r_t | \textbf{x}_{1:t}) \qquad \qquad (1) txtxtx_tは時間での観測です。ttt tx1:tx1:t\textbf{x}_{1:t}は、時刻までの一連の観測を示します。ttt rt∈Nrt∈Nr_t \in \mathbb{N}は現在のランレングスです(最後の変化点からの時間。0でもかまいません)。そして r tx(r)txt(r)\textbf{x}_t^{(r)}は、実行関連付けられた観測値のセットです。rtrtr_t Eq。1は正式に正しい(@JuhoKokkalaによる以下の返信を参照)が、について実際に予測したい場合は、次のように展開する必要があると理解しています。xt+1xt+1x_{t+1} P(xt+1|x1:t)=∑rt,rt+1P(xt+1|rt+1,x(r)t)P(rt|x1:t)P(rt+1|rt)(1b)P(xt+1|x1:t)=∑rt,rt+1P(xt+1|rt+1,xt(r))P(rt|x1:t)P(rt+1|rt)(1b) P(x_{t+1} | \textbf{x}_{1:t}) = \sum_{r_t, r_{t+1}} P(x_{t+1} | r_{t+1}, \textbf{x}_t^{(r)}) P(r_t | \textbf{x}_{1:t}) P(r_{t+1} | r_t) …

2
確率的プログラミングによるスイッチポイント検出(pymc)
私は現在、ハッカーの確率的プログラミングとベイジアン手法の「本」を読んでいます。私はいくつかの章を読み、最初の章について考えていました。pymcの最初の例は、テキストメッセージ内の魔女の検出で構成されています。この例では、スイッチポイントが発生していることを示すランダム変数が示されています。MCMCステップの後、事後分布 が与えられます。τττ\tauττ\tau まず、このグラフからわかることは、スイッチポイントが45日目に発生した確率はほぼ50%であるということです。スイッチポイントがない場合はどうなりますか?スイッチポイントがあると想定してそれを見つけようとするのではなく、実際にスイッチポイントがあるかどうかを検出したいと思います。 著者は、「スイッチポイントが発生したのか」という質問に「変化がなかった場合、または時間の経過とともに変化が​​緩やかだった場合、事後分布は より広がっていただろう」と回答しています。しかし、どのように適切な方法でこれに答えることができますか。たとえば、スイッチポイントが発生した確率は90%であり、45日目に発生した確率は50%です。ττ\tau モデルを変更する必要がありますか?または、これは現在のモデルで答えることができますか?

2
時系列のゼロ平均部分を見つけるための最新の方法
ノイズの多い時系列があり、平均がゼロの部分と平均がゼロの部分に分割する必要があります。境界をできるだけ正確に見つけることが重要です(境界が正確にどこにあるかを明らかにすることは、少し主観的です)。私はcusumバリアントをこれに適合させることができると思いますが、cusumは主に、セグメンテーション戦略全体を完全に対処しないままにする単一の変更を見つけることに関するものです。 この問題については多くの調査が行われたと思いますが、見つけることができませんでした。 PSこれらの時系列のデータ量は非常に大きく、つまり最大で数億のサンプルであり、個々のサンプルは数百の成分を持つベクトルになる可能性があるため、合理的に迅速に計算できる方法は重要な要素です。 PPSセグメンテーションタグがないため、分類タグがあります。

1
変化点分析
誰かが私に変化点を説明してくれませんか。私はRでパッケージを使用していますが、さまざまな方法の意味、それぞれの長所と短所がよくわかりません。特にペナルティの値がわかりません。ペナルティ値を増やすと、それはどういう意味で、何をしますか?私はオンラインでかなりの量の調査を行いましたが、Cran RとQuick Rのサイトを見つけ続けていますが、それは良いことです。 本当にありがとう。

1
チャウテストかどうか?
多数の時系列で構造的な破損を検出する自動画面を設定しようとしています。 時系列は毎週であり、顧客の行動を表します。チャウテストを設定しました。私は最近の4週間を使用して、それを直前の22週間と比較します。彼らの最近の行動が前回の行動と大幅に異なるかどうかを知りたいです。 私の質問はこれです: チャウテストはこの質問に最も適切なテストですか? これが最も適切なテストではない場合、どのテストが最も適切なテストかをどのように判断できますか?

2
時系列のステップの検出
私が話している時系列の写真を添付し​​ました。上が元のシリーズ、下が差分のシリーズです。 各データポイントは、ひずみゲージからの5分間の平均読み取り値です。このひずみゲージは機械に設置されます。ノイズの多い領域は、マシンがオンになっている領域に対応しています。クリーンな領域は、マシンがオフになっているときです。赤い丸で囲まれた部分を見ると、読みに異常なステップがあり、自動的に検出したいと思います。 私はこれをどのように行うことができるかについて完全に困惑しています-アイデアはありますか?
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.