「時系列分析」と「縦断的データ分析」という用語の違いは何ですか


17

縦断的データについて話すとき、同じ被験者/学習ユニットから繰り返し収集されたデータを参照する場合があります。したがって、同じ被験者内の観察、つまり被験者内の類似性には相関があります。

時系列データについて話すとき、一連の時間にわたって収集されたデータも参照します。これは、上記の縦断的設定と非常によく似ています。

誰かがこれらの2つの用語の間の明確な説明を提供できるかどうか疑問に思っています、関係とは何ですか、違いは何ですか?


1
これは世論調査に変わる可能性があります...私は両方のタイプのデータに取り組んできましたが、1つの重要な違いは、時系列がしばしば使用されるのに対し、介入または治療の影響を理解するために、縦断データが因果分析でよく使用されることですで予測。もちろん、違いは明確ではありません(予測するための基礎となるドライバーを理解する必要があります。また、よく予測できない限り、IMOはドライバーを理解していません)。しかし、時系列で信号検出を行う人々は、しばしば予測をあまり気にしないので、おそらく私の区別を拒否するでしょう。
S. Kolassa -復活モニカ

コメントしてくれてありがとう。しかし、ここでは「因果関係」という用語は適切ではないかもしれませんが、「連合」という用語の方が良いはずです。データ分析の目的に関しては、あなたのコメントは私にとって意味があると思います。しかし、予測を行うために縦断的データを使用することはできませんか?また、時系列データの一種でもあります。
質問14

1
「因果関係」対「関連性」についてのポイントがあります。もちろん、縦断的データを使用して予測することもできます。2つの概念を一緒に見ることはあまりありません。通常、予測者は時系列について話します。それとは別に、@ gungよりも優れたものはありませんでした。
S. Kolassa -復活モニカ

3
tt1

回答:


19

幅広いデータアナリストが同意する厳密で正式な定義があるとは思いません。

ただし、一般的に、時系列とは、非常に長期間にわたって一定の間隔で観察される単一の学習単位を意味します。典型的な例は、数十年、さらには100年以上にわたる国の年間GDP成長率です。民間企業で働くアナリストにとっては、企業の生涯にわたる毎月の売り上げかもしれません。多数の観測があるため、データは非常に詳細に分析され、さまざまな期間の季節性などが検索されます(例:月:支払い直後の月の初めに売上が増加し、年:11月に売上が増加し、 12月、人々はクリスマスシーズンに向けて買い物をしています)、そしておそらく政権交代です。@StephanKolassaが指摘しているように、予測はしばしば非常に重要です。

通常、縦断は、より多くの学習ユニットでの測定値が少ないことを指します。プロトタイプの例としては、数百人の患者がベースライン(治療前)で測定され、今後3か月間毎月測定される薬物試験があります。この例では各ユニットを4回だけ観察するだけで、時系列アナリストが関心を持っている機能の種類を検出しようとすることはできません。非独立性が対処されています。それが示唆するように、多くの場合、非独立性は、関心のある主要な特徴ではなく、ほとんど迷惑と見なされます。


8

およそ3種類のデータセットがあります。

  • 断面:​​同時に異なる主題; さまざまな主題に対応する多くの列を持つ1つの行と考えてください。
  • 時系列:異なる時間に同じ主題。異なる時点に対応する行を持つ1つの列と考えてください。
  • パネル(縦):異なる時間に多くの被験者、異なる時間に同じ被験者があり、同時に多くの被験者がいます。行が時点であり、列が主題であるテーブルと考えてください。

2
あなたのコメントに基づいて、縦断的データは異なる被験者から収集された複数の時系列データのセットであると思われますか?
質問14

1
一般的に、はい、各被験者のデータを時系列で見ることができます。ただし、実際には、縦断データの場合、各被験者のタイムポイントはほとんどありません。彼らは時間点をと呼びます。たとえば、各患者が1か月ごとに4〜5個の観察結果を持ち、何年にもわたって何百人もの患者がいる医学研究である可能性があります。このように、パネルデータセットはしばしば不均衡です(非常にまばらなテーブルと考えてください)。したがって、縦断的研究には、これに対処する独自の方法があります。
アクサカル14

これは質問を考えると役に立ちますが、これらの見出しのいずれにも該当しないデータセットには他にも多くの種類があります。ただし、それらは質問に関連していないようであり、すべての可能な種類のデータセットを分類しようとすると、ここでは無駄になります。例:基本構造がサブジェクトxサブジェクトであるデータセット。二次元ではないデータセット。
ニックコックス

@NickCox、本当ですが、私は計量経済学で、これらの3つは発展した理論を持っており、主に私たちの分野で使用されています
Aksakal

2
疑う余地はありませんが、質問のどれも、狭い計量経済学的視点を義務付けたり、奨励したりするものでもなく、具体的な視点も明示されていません。
ニックコックス

3

これらの2つの用語は、OPが想定する方法に関連していない可能性があります。つまり、競合する分析モードではないと思います。

代わりに、時系列分析では、縦断的研究でデータを分析するのに役立つ可能性のある一連の低レベルの手法について説明します。

時系列分析の研究対象は、時間に依存する信号です。

これらの時間依存信号を分析およびモデリング/予測するほとんどの手法は、これらの信号がさまざまなコンポーネントに分解可能であるという前提に基づいて構築されています。最も重要な2つは次のとおりです。

  • 周期的なコンポーネント(例:毎日、毎週、毎月、季節)。そして

  • 傾向

言い換えれば、時系列分析は、基礎となる信号を抽出するために、時間依存信号の周期的な性質を利用することに基づいています。


0

簡単にするために、個人の研究を想定しますが、分析のどのユニットにも同じことが当てはまります。複雑ではありません。時系列は時間をかけて収集されたデータであり、通常は、同じ母集団から別々の時間間隔で同じ測定値を意味します。
範囲がはるかに長い縦断データ。同等の母集団は同一の母集団に置き換えられるため、個々のデータは時間の経過とともにペアリングまたは結合されます。縦断的データは、研究の目的に応じて繰り返し測定することも、しないこともできます。縦断的データが時系列のように見える場合とは、時間の経過とともに同じものを測定することです。大きな違いは、時系列では、経時的な(またはグループごとの)測定の全体的な変化を測定できるのに対し、縦断的分析では、実際に個々のレベルで変化を測定できることです。したがって、分析の可能性がはるかに高く、サンプリングが含まれる場合、変化の測定はエラーなしで行われるため、縦断的研究はより正確で有益です。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.