私はFDAでジムラムゼイと数年間働いていたので、@ amoebaの答えにいくつかの説明を加えることができます。実用レベルでは、@ amoebaは基本的に正しいと思います。少なくとも、FDAを研究した後、私がついに達成した結論です。ただし、FDAフレームワークは、固有ベクトルの平滑化が単なる手がかり以上のものである理由について興味深い理論的洞察を提供します。滑らかさのペナルティを含む内積の影響を受ける関数空間での最適化により、基底スプラインの有限次元解が得られることがわかりました。FDAは無限次元の関数空間を使用しますが、分析には無限の次元数は必要ありません。これは、GaussianプロセスまたはSVMのカーネルトリックのようなものです。実際には、カーネルのトリックによく似ています。
ラムゼイのオリジナルの作品は、データの主なストーリーが明らかな状況を扱っていました。関数は多かれ少なかれ線形であるか、多かれ少なかれ周期的です。標準PCAの主要な固有ベクトルは、関数の全体的なレベルと線形トレンド(または正弦関数)を反映するだけで、基本的には既にわかっていることを教えてくれます。興味深い特徴は残差にあります。残差はリストの最上部からのいくつかの固有ベクトルです。また、後続の各固有ベクトルは前の固有ベクトルと直交する必要があるため、これらの構成要素は分析のアーティファクトにますます依存し、データの関連する特徴に依存しなくなります。因子分析では、斜め因子回転はこの問題を解決することを目的としています。ラムゼイのアイデアは、コンポーネントを回転させることではなく、むしろ、分析のニーズをより適切に反映する方法で直交性の定義を変更します。これは、定期的なコンポーネントに関心がある場合は、D3− D、サインとコンサインを排除します。線形トレンドを削除したい場合は、に基づいて滑らかになりますD2 標準の3次スプラインが得られます。
OLSを使用して傾向を取り除き、その操作の残差を調べる方が簡単であることに反対する人もいるかもしれません。FDAの付加価値がこの方法の非常に複雑な価値があると確信したことはありませんでした。しかし、理論的な観点からは、関係する問題を検討する価値があります。データに対して行うすべてのことは、物事を台無しにします。元のデータが独立していても、OLSの残差は相関しています。時系列を平滑化すると、生の系列にはなかった自己相関が導入されます。FDAの考え方は、最初のトレンド除去から得た残差が関心のある分析に適していることを保証することでした。
FDAは、スプライン関数が活発に研究されていた80年代初期に生まれたことを覚えておく必要があります。グレースワバと彼女のチームについて考えてみてください。それ以来、多変量データに対する多くのアプローチが登場しました-SEM、成長曲線分析、ガウス過程、確率過程理論のさらなる発展など。FDAが対処する質問に対する最善のアプローチであるかどうかはわかりません。一方、FDAを意図したアプリケーションを見ると、FDAが何をしようとしているかを著者が本当に理解しているかどうかをよく疑問に思います。