機能データ分析と高次元データ分析の違いは何ですか


10

統計文献には、「機能データ」(つまり、曲線であるデータ)、および「高次元データ」(つまり、データが高次元ベクトルの場合)への言及がたくさんあります。私の質問は、2つのタイプのデータの違いについてです。

ケース1に適用される適用された統計的方法論について話す場合、ケース2から方法論を関数の空間の有限次元部分空間への射影を通じて言い換えると、多項式、スプライン、ウェーブレット、フーリエなどが考えられます... 。そして、機能問題を有限次元ベクトル問題に変換します(適用された数学では、すべての点ですべてが有限になるため)。

私の質問は 、機能データに適用される統計手順は高次元データにも(ほぼ直接)適用でき、高次元データ専用の手順は機能データに(ほとんど直接)適用できると言えるでしょうか。

答えが「いいえ」の場合、説明できますか?

サイモンバーンの回答を利用した編集/更新:

  • スパース性(S-sparse仮定、 ballおよび弱い ball )は、高次元統計分析の構造的仮定として使用されます。lplpp<1
  • 「滑らかさ」は、機能データ分析の構造的仮定として使用されます。

一方、逆フーリエ変換と逆ウェーブレット変換は、スパース性を滑らかさに変換し、滑らかさはウェーブレットとフーリエ変換によってスパース性に変換されます。これは、サイモンが言及した重要な違いをそれほど重要ではないものにしますか?


1
平滑化機能データ分析の大部分を占めており、適切な基底(フーリエやウェーブレットなど)に投影することでベクトル平均推定問題に変換できますが、機能構造によっては、他の問題が機能データ分析に存在します。簡単には翻訳できません。共変量からの関数応答を予測することに関心がある関数回帰の例を見てみましょう。
vqv

回答:


12

機能データには、しばしば異なる質問が含まれます。私は関数型データ分析、ラムジーとシルバーマンを読んでいて、彼らは多くの時間を費やして、曲線の登録、ワーピング関数、および曲線の導関数の推定について議論しています。これらは、高次元データの研究に関心のある人が尋ねる質問とは非常に異なる質問になる傾向があります。


完全に同意します !尋ねられる質問は異なります。機能ビューから、登録、ランドマーク、派生物の推定を行うことができます。これは私を納得させる!それで、関数データ(統計文献にあるように)での大事なことは、それが連続セットで定義されているということではなく、順序付けられたセットでインデックス化されているということでしょうか?
ロビンギラード

順序付きセットで定義されているだけではありません。それ以外の場合、時系列分析と機能データ分析をどのように区別しますか?私が@ user549に同意するのは、結局、尋ねられる質問のタイプに要約されるということです。それらはデータの構造に固有です。
vqv

15

はいといいえ。理論的なレベルでは、どちらのケースでも同様の手法とフレームワークを使用できます(ガウスプロセス回帰が優れた例です)。

重要な違いは、過剰適合(正規化)を防ぐために使用される仮定です。

  • 関数型の場合、通常は滑らかさの仮定がいくつかあります。つまり、互いに近接して発生する値は、何らかの体系的な方法で類似しているはずです。これにより、スプライン、レス、ガウス過程などの手法が使用されます。

  • 高次元の場合、通常、スパース性の仮定があります。つまり、次元のサブセットのみが信号を持ちます。これは、それらの次元を特定することを目的とした手法につながります(なげなわ、LARS、スラブとスパイクの事前分布など)。

更新:

ウェーブレット/フーリエ法についてはあまり考えていませんでしたが、そうした方法で使用されるしきい値処理手法は、投影された空間のスパース性を目的としています。逆に、一部の高次元手法では、低次元多様体への射影(主成分分析など)を想定しています。これは、滑らかさの仮定の一種です。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.