回答:
そこ3つの主な機能は、Changepointのパッケージであるcpt.mean
、cpt.var
とcpt.meanvar
。実務家として、これらはパッケージで必要な唯一の関数です。データに平均値の変化が含まれていると思われる場合は、cpt.mean
関数などを使用します。
次の質問では、データ内の単一の変更を探しているのか、複数の変更を探しているのかを自問する必要があります。method
引数には、複数の変更のために最大1つの変更、および毛皮、BinSegとSegNeighためアモクがあり、これを処理します。使用する複数のチェンジポイントメソッドは、次の条件によって異なります。
a)ディストリビューション/ディストリビューションなしの方法の選択(下記を参照)および
b)どれだけの時間があるか、どれだけ正確に答えたいか。BinSegは高速ですが概算です。PERTは正確で高速ですが、すべてのディストリビューションで使用できるわけではありません。SegNeighは正確ですが低速です。
次の質問は、データについてどのような想定ができる/進んで行うかです。ここで重要なのは、仮定がデータ全体ではなく、変更間の各データセットに適用されることです。たとえば、正規分布を想定できる場合がありますが、データ全体に対して正規性のテストを実行すると、(潜在的な変更により)失敗する可能性が高くなります。したがって、通常は仮定を行い、変更点分析を実行して、特定された変更に基づいて仮定を確認します。この場合も、変更の種類に応じて、配布方法と配布なしの方法が異なります。選択肢については、各関数のドキュメントを参照してください。使用することを検討している検定統計量を自由にコメントしてください。また、仮定をリストできます。
最後に、ペナルティを確認します。ペナルティは、多くの小さな変更と変更なしの間の妥協点を提供します。したがって、ペナルティを0に設定すると、可能なすべての場所で変更が行われ、ペナルティを無限に設定すると、変更は行われません。ペナルティの適切な値は、データと回答する質問によって異なります。たとえば、平均0.5単位の変化があるかもしれませんが、1 +単位の変化だけに関心があるかもしれません。ペナルティを選択するには多くの方法があります。
「目で」、つまり、問題に適した値が見つかるまで、いくつかの異なる値を試してください。
「elbow-plot」、つまり、使用されたペナルティに対して識別された変化点の数をプロットします。これにより曲線が作成され、ペナルティの小さな値によって大きな(偽の)変化が生じます。ペナルティが減少すると、これらの偽の変化は速い速度で低下します。大きなペナルティの変化がないまでゆっくりと低下する前に、真の変化のみが残されるため、この速度は遅くなります。 。アイデアは、この曲線に2つの直線を適合させ、それらが交差するペナルティを選択することです。これにより、アドホックですが、ペナルティを選択する方法が1よりも客観的になります。
情報量基準を使用します。パッケージにはAIC、BIC / SIC、阪南Quinnなどが含まれています。パッケージに含まれていないものもありますが、必要にpen.value
応じて式を指定できます。
特定のポイントに関する詳細情報や説明が必要な場合は、コメントしてください。回答させていただきます。