タグ付けされた質問 「stationarity」

厳密に定常的なプロセス(または時系列)とは、時間シフトにわたってジョイント分布が一定であるプロセスです。弱定常(または共分散定常)プロセスまたは系列は、平均および共分散関数(分散および自己相関関数)が時間とともに変化しないものです。

3
異分散性と非定常性の概念的な違い
分散性と定常性の概念を区別するのに苦労しています。私が理解しているように、異分散性は部分母集団の変動性が異なり、非定常性は時間の経過とともに変化する平均/分散です。 これが正しい(単純化ではあるが)理解である場合、非定常性は単に、時間の経過に伴う不均一分散の特定のケースですか?

1
一定の平均値を持つ時系列の名前は何ですか?
の平均が存在し、すべての時間について一定であるランダムプロセスを考えます。つまり、すべての時間および時間シフト(または「遅れ」)。高いモーメントや分布関数にはこれ以上の条件を課しません。そのようなプロセスをどのように説明できますか?「弱い定常」(つまり、2次の定常性)よりも弱い意味でのみ定常です。E(X T)T E(X T)= E(X T + τ)T τ{ Xt}{Xt}\{X_t\}E( Xt)E(Xt)\mathbb{E}(X_t)tttE( Xt)= E(Xt + τ)E(Xt)=E(Xt+τ)\mathbb{E}(X_t)=\mathbb{E}(X_{t+\tau})tttττ\tau 他の形式の定常性には多くの名前があります。たとえば、弱い場合に「広義の定常」または「共分散定常」を追加することもできます。したがって、いくつかの可能な用語が当てはまると思いますが、考えられるすべての用語には欠点があります。 一次固定、または注文一方に固定は、「二次固定」と「順に静止に類似している」は、しばしばより高いモーメントのために使用される製剤。しかし、平均値が一定のプロセス(ここでは例)で使用される「1次定常」を見てきたが、信号処理で異なる意味で一般的に使用され、検索エンジンのヒットの大部分を提供するフィールド。私がチェックしたすべての信号処理の本は、一次分布関数が時間に対して不変である場合、つまり、すべての時間、と値シフトしますF X (T )(X )= F X (T + τ )(X )T τ X F X (T 1)、X (T 2)(X 1、X 2)= F X (T 1 + τ )、X (t 2 + τ )(xんnnFバツ(t …

3
機械学習手法を使用する場合、時系列データをトレンド除去およびリサイクルする必要がありますか?
例えば: ANNやSVMを使用して、複数の時系列の以前の値に基づいて時系列の将来の値を予測したい。入力は各時系列からの遅れた値であり、出力は1ステップ先の予測になります(これまでの予測を使用して予測を前方に「ローリング」することにより、さらなる視野を持つ予測が行われます)。 さて、SVMとANNはトレンドとサイクルを学習できてはなりませんか?「他のすべてが等しい場合、このシリーズの出力は前の出力の2倍になるはずです」などのことを学習できませんか?または、月のカテゴリ変数を指定した場合、「1月なので、行った予測を2で割りますか?」 データをリサイクルおよびトレンド除去しようとすると、必要以上にバイアスがかかりますか?

4
定常系列の絶対値も定常ですか?
(弱い)定常過程から生じる時系列の線形変換も定常であることを知っています。しかし、これは各要素の絶対値を取ることによる系列の変換にも当てはまりますか?つまり、が静止している場合、静止していますか?{xi,i∈N}{xi,i∈N}\{x_i,i\in\mathbb{N}\}{|xi|,i∈N}{|xi|,i∈N}\{|x_i|,i\in\mathbb{N}\}

1
プロセスの定常分布の直感的な説明/動機
多くの場合、文学では、著者は時系列プロセスの定常分布を見つけることに関心を持っています。たとえば、次の単純なAR(検討)プロセス:。111{Xt}{Xt}\{X_t\}Xt=αXt−1+et,Xt=αXt−1+et,X_t = \alpha X_{t-1} + e_t, et∼iidfet∼iidfe_t\stackrel{iid}{\thicksim} f 確率過程の定常分布を見つける動機は何でしょうか? 結果の定常分布を使用して、他にどのような(理論的および実用的な)分析を行うことができますか? 定常分布が存在しない場合の問題は何ですか?プロセスは役に立たなくなりますか? 定常分布は存在するが、閉形式がない場合はどうなりますか?同じの閉形式表現がないことの欠点は何ですか?

1
定常系列のサンプル自己相関の合計が-1/2になるのはなぜですか?
この定常系列の特性と自己相関関数について頭をつかむことができません。私はそれを証明しなければなりません ∑h=1n−1ρ^(h)=−12∑h=1n−1ρ^(h)=−12\begin{align} \sum_{h=1}^{n-1}\hat\rho(h)=-\frac{1}{2} \end{align} ここで、およびは自動共分散関数ですγ(H)ρ^(h)=γ^(h)γ^(0)ρ^(h)=γ^(h)γ^(0)\hat\rho(h)=\displaystyle\frac{\hat\gamma(h)}{\hat\gamma(0)}γ^(h)γ^(h)\hat\gamma(h) γ^(h)=1n∑t=1n−h(Xt−X¯)(Xt+h−X¯)γ^(h)=1n∑t=1n−h(Xt−X¯)(Xt+h−X¯)\begin{align} \hat\gamma(h) = \frac{1}{n}\sum_{t=1}^{n-h}(X_t-\bar{X})(X_{t+h}-\bar{X}) \end{align} うまくいけば、誰かが証明を手伝ってくれるか、少なくとも私を正しい方向に向けることができます。

2
膨大なデータセットが与えられた場合、なぜ統計モデルは過剰適合しますか?
現在のプロジェクトでは、特定のグループの行動を予測するモデルを構築する必要があるかもしれません。トレーニングデータセットには6つの変数のみが含まれます(idは識別目的のみです)。 id, age, income, gender, job category, monthly spend その中で monthly spend応答変数です。ただし、トレーニングデータセットには約300万行が含まれid, age, income, gender, job category、予測されるデータセット(応答変数は含まれるが、含まれない)には100万行が含まれます。私の質問は、統計モデルにあまりにも多くの行(この場合は300万行)を投げた場合に潜在的な問題はありますか?計算コストが懸念事項の1つであることを理解していますが、他に懸念事項はありますか?データセットのサイズの問題を完全に説明している本/紙はありますか?
8 modeling  large-data  overfitting  clustering  algorithms  error  spatial  r  regression  predictive-models  linear-model  average  measurement-error  weighted-mean  error-propagation  python  standard-error  weighted-regression  hypothesis-testing  time-series  machine-learning  self-study  arima  regression  correlation  anova  statistical-significance  excel  r  regression  distributions  statistical-significance  contingency-tables  regression  optimization  measurement-error  loss-functions  image-processing  java  panel-data  probability  conditional-probability  r  lme4-nlme  model-comparison  time-series  probability  probability  conditional-probability  logistic  multiple-regression  model-selection  r  regression  model-based-clustering  svm  feature-selection  feature-construction  time-series  forecasting  stationarity  r  distributions  bootstrap  r  distributions  estimation  maximum-likelihood  garch  references  probability  conditional-probability  regression  logistic  regression-coefficients  model-comparison  confidence-interval  r  regression  r  generalized-linear-model  outliers  robust  regression  classification  categorical-data  r  association-rules  machine-learning  distributions  posterior  likelihood  r  hypothesis-testing  normality-assumption  missing-data  convergence  expectation-maximization  regression  self-study  categorical-data  regression  simulation  regression  self-study  self-study  gamma-distribution  modeling  microarray  synthetic-data 

1
定常性-仮定と検討
150 x 150メートルで、15メートル間隔で等間隔​​に配置された121のトラップステーションで構成される6つの恒久的なげっ歯類捕獲グリッドでのげっ歯類の捕獲を調べています。調査サイトには、サイズが1000ヘクタール未満のこのようなトラップグリッドが6つあります。キャプチャデータを補間して、げっ歯類の活動のクリグドサーフェスを作成します。補間の前提は、データが静止していることです。 フォルタン&デール(2005)の状態 定常性は、サンプリングされていない場所でのデータの空間構造のプロセスを特徴付けるモデルから推論を行うために必要です。 私が理解していることから、その統計的特性(平均と分散)が空間全体で変化しない場合、プロセスは定常的であると説明できます。 しかし、最初に空間分析を行う理由は、空間全体の変動ではないでしょうか。 定常性は、空間/地理統計分析の文献で頻繁に紹介されていますが、私はまだ確かな方向性と情報を見つける必要があります どのスケール、またはどのタイプの研究についても、データが静止していると仮定するのが妥当です。 データを検査および検証する方法が定常的であり、最後に ある方法でいったん定量化されると、ある領域から次の領域へのどれだけの違いがデータを非定常として認定しますか? これまでのところ、文献をレビューした後、概念と定常性の検査は非常に主観的、恣意的、および/または難読化されているようです。 誰かがこの問題について実用的なアドバイスを提供できるなら、私はそれを大いに感謝します!

1
定常ガウスフィールドとは何ですか?
ガウス体とは何か知っています。しかし、私は文房具が何を意味するのかよくわかりません。静止した自己回帰プロセスなどの多くの場所でこの静止したものを見たことがありますが、実際には静止したことの意味がわかりません。

2
定常ARMA方程式の非定常解
「静止」とは「弱い静止」を意味します。 「定常」AR(1)方程式を考えます。 Xt=φXt−1+εt,Xt=φXt−1+εt,X_t=\varphi X_{t-1}+\varepsilon_t, ここでは離散時間モーメント、はゼロ平均ホワイトノイズ(一部のiidシーケンス)、。定常解(つまり、方程式を満たす離散時系列)があることはよく知られています。表ししかし、我々は、一連の他の時間導入することができる「固定」式(明確にするための非定常溶液であるように見える、自由ではないので、明らかであるがゼロ平均)。t∈Zt∈Zt\in\mathbb{Z}εtεt\varepsilon_tφ∈(−1,1)φ∈(−1,1)\varphi\in(-1,1)Xt.Xt.X_t.Yt=Xt+φtYt=Xt+φtY_t=X_t+\varphi^tE[Yt]E[Yt]\mathbb{E}[Y_t]tttXtXtX_t より一般的な定常AR()プロセスを考えると、弱い定常性特性を何らかの形で損なうことは可能ですか?または、一般的に、定常的な離散時間AR(またはARMA)方程式に非定常解があることは本当ですか?ppp

2
定常時系列とは何ですか?いくつかの例は何ですか?
私の計量経済学のクラスでは、教師は次のように定常時系列を定義しました。私はいくつかの例がどうなるかについて混乱しています。トレンドがないと仮定すると、年間を通じて気温は一定でしょうか?定常性とは、データ内の唯一の動きがランダムなホワイトノイズに起因することを意味しますか?いくつかの例は何ですか?例に困惑しています。

1
ARプロセスの開始点の分布
モデル確率過程ます。ここでです。{バツt、t = 1 、 2 、... }{Xt,t=1,2,…}\{X_t, t = 1, 2, \ldots\}バツt= αバツt − 1+et、Xt=αXt−1+et,X_t = \alpha X_{t-1} + e_t,et〜Fet∼fe_t \thicksim f 初期点分布はと同じだと言えますか?バツ1X1X_1fff の定常限界密度が存在する場合、と同じであると言えますか?{バツt}{Xt}\{X_t\}バツ2(=Dαバツ1+e2)X2(=DαX1+e2)X_2 (\stackrel{D}{=}\alpha X_1 + e_2) の定常限界密度(存在する場合)はと同じですが、と同じである必要はないと思います。{バツt}{Xt}\{X_t\}バツ2X2X_2バツ1X1X_1
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.