縦断的データについて話すとき、同じ被験者/学習ユニットから繰り返し収集されたデータを参照する場合があります。したがって、同じ被験者内の観察、つまり被験者内の類似性には相関があります。
時系列データについて話すとき、一連の時間にわたって収集されたデータも参照します。これは、上記の縦断的設定と非常によく似ています。
誰かがこれらの2つの用語の間の明確な説明を提供できるかどうか疑問に思っています、関係とは何ですか、違いは何ですか?
縦断的データについて話すとき、同じ被験者/学習ユニットから繰り返し収集されたデータを参照する場合があります。したがって、同じ被験者内の観察、つまり被験者内の類似性には相関があります。
時系列データについて話すとき、一連の時間にわたって収集されたデータも参照します。これは、上記の縦断的設定と非常によく似ています。
誰かがこれらの2つの用語の間の明確な説明を提供できるかどうか疑問に思っています、関係とは何ですか、違いは何ですか?
回答:
幅広いデータアナリストが同意する厳密で正式な定義があるとは思いません。
ただし、一般的に、時系列とは、非常に長期間にわたって一定の間隔で観察される単一の学習単位を意味します。典型的な例は、数十年、さらには100年以上にわたる国の年間GDP成長率です。民間企業で働くアナリストにとっては、企業の生涯にわたる毎月の売り上げかもしれません。多数の観測があるため、データは非常に詳細に分析され、さまざまな期間の季節性などが検索されます(例:月:支払い直後の月の初めに売上が増加し、年:11月に売上が増加し、 12月、人々はクリスマスシーズンに向けて買い物をしています)、そしておそらく政権交代です。@StephanKolassaが指摘しているように、予測はしばしば非常に重要です。
通常、縦断は、より多くの学習ユニットでの測定値が少ないことを指します。プロトタイプの例としては、数百人の患者がベースライン(治療前)で測定され、今後3か月間毎月測定される薬物試験があります。この例では各ユニットを4回だけ観察するだけで、時系列アナリストが関心を持っている機能の種類を検出しようとすることはできません。非独立性が対処されています。それが示唆するように、多くの場合、非独立性は、関心のある主要な特徴ではなく、ほとんど迷惑と見なされます。
およそ3種類のデータセットがあります。
これらの2つの用語は、OPが想定する方法に関連していない可能性があります。つまり、競合する分析モードではないと思います。
代わりに、時系列分析では、縦断的研究でデータを分析するのに役立つ可能性のある一連の低レベルの手法について説明します。
時系列分析の研究対象は、時間に依存する信号です。
これらの時間依存信号を分析およびモデリング/予測するほとんどの手法は、これらの信号がさまざまなコンポーネントに分解可能であるという前提に基づいて構築されています。最も重要な2つは次のとおりです。
周期的なコンポーネント(例:毎日、毎週、毎月、季節)。そして
傾向
言い換えれば、時系列分析は、基礎となる信号を抽出するために、時間依存信号の周期的な性質を利用することに基づいています。
簡単にするために、個人の研究を想定しますが、分析のどのユニットにも同じことが当てはまります。複雑ではありません。時系列は時間をかけて収集されたデータであり、通常は、同じ母集団から別々の時間間隔で同じ測定値を意味します。
範囲がはるかに長い縦断データ。同等の母集団は同一の母集団に置き換えられるため、個々のデータは時間の経過とともにペアリングまたは結合されます。縦断的データは、研究の目的に応じて繰り返し測定することも、しないこともできます。縦断的データが時系列のように見える場合とは、時間の経過とともに同じものを測定することです。大きな違いは、時系列では、経時的な(またはグループごとの)測定の全体的な変化を測定できるのに対し、縦断的分析では、実際に個々のレベルで変化を測定できることです。したがって、分析の可能性がはるかに高く、サンプリングが含まれる場合、変化の測定はエラーなしで行われるため、縦断的研究はより正確で有益です。