「機械学習者」からの統計的な金融時系列モデルに関するいくつかの質問


9

なぜ私がこれらの愚かな質問をするのかを説明するために、以下で見つけることができます。私はより機械学習の人であると言わなければなりません。私はバイオインフォマティクスの問題に取り組みましたが、すべてが順調でした。「回帰」や「尖度とゆがみ」などの言葉を聞いたとき、最初は微笑んだだけで、2番目のケースは「はい、聞いたことがある。それを計算する方法を知っていますが、なぜ地球上で誰もがそれを必要とするのですか?」

1年前の状況は劇的に変化しました。楽しみのために、機械学習の知識をいくつかの財務時系列に適用しようとしました。

「テクニカル」「分析」「指標」から提供される信号からベイジアンネットワークを作成することから始めました。アイデアは失敗しました。また、このサイト(ベイジアンの代わりにニューラルネットワークを使用)で同様のアイデアを持つ少なくとも2つのトピックを見つけることは、いくらか喜ばしいことでした。

次に、多くの努力の結果、kNNとシンボリック回帰の混合を構築することができました。これは、2000年から2006年までの1時間のデータでトレーニングし、2007年のデータでテストしました。しかし、それを最新のデータに適用すると、経済の急激な変化により精度が大幅に低下し、市場で何かが変化し、2-5でしか取得できない新しいデータが必要になったため、精度が低下していることに気付きました。年。

後で、たくさんのことを試しましたが、もしこのすべてが「ただの楽しみ」として始まったとしたら、それはもう楽しくありませんでした。私がARIMA、GARCH、TARやその他のまったく新しいものについてRuey S. Tsayのオンライン講義を見つけるまでは。

基本的に私は全く新しい世界を見つけ、それを本当に楽しんでいます。現在、私は最初のARIMAモデルに適合させることができました。次に、ACF、PACF、季節性などを検討することにより、rms-errorを2回削減するように調整しました。

さて、楽しみは戻ってきました、私はそれをたくさん持っていました、そして私はもっと持っていると期待しています しかし、いくつか質問があり、この素晴らしいサイトを見つけました。ここでは、ARIMAとその他の関連技術に関するほぼすべてのトピックを読み、同様のアプローチに関連する他の多くの一般的なトピックも読んでください。確かにもっと読むでしょう。私はまだ機械学習アプローチの考え方の枠内で考えています。それは多くの愚かな質問につながり、そのほとんどはこのサイトで答えを見つけます。

だから、この長い紹介の後に、私の残りの愚かな質問があります:

  1. 機械学習アプローチはデータ内の「パターン」を見つけることについてより関心がありますが、ランダムウォーク理論を広く使用する金融時系列の統計モデル(パターンの存在を少なくとも疑わしくします)と矛盾します。非常にナイーブで誤った説明ですが、私が言いたいのは、ほとんどの機械学習手法は、問題に対する統計的アプローチと概念的に矛盾しているということです。いくつかのアプローチの方が優れていると言っているのではなく、矛盾していると言っているだけです。それは正しいですか、この矛盾はどのくらい大きいですか?

  2. 機械学習と統計の融合のように見えるTARモデルの説明とアイデアが本当に気に入りました。これは、ARIMAにGARCHを追加した後で次に試してみたいモデルです。しかし、私はそれについていくつか質問があります:

    • TARは統計的手法と機械学習手法の両方を使用しています。それで、私の最初の質問を念頭に置いて、モデルのセットのパターンを見つけようとすると、基本的にパターンを除外する理論に基づいて構築されていますが、エラーはありませんか?または、同じ問題のさまざまな側面を研究する2つのモデルを1つのさらに強力なモデルに結合する方法の単なるアイデアですか?

    • このサイトで「ARIMA」というキーワードで検索すると、15ページのトピックが表示されますが、TARの場合は1つしかありません。また、なぜARの適用をやめたのですか?このアイデアをより複雑なモデル(ARIMAなど)に拡張してみませんか?TARがARに対して期待された改善を提供しなかったからでしょうか?

  3. MCMCの手法やその他の機械学習の要素が現在統計モデルと混合されていることを知っています。個人的には、隠れマルコフモデルと条件付きランダムフィールドの大ファンでもあります。これらの方法と統計モデルの混合について知っていますか?


1
ARIMAは通常、ARとは別のモデルというよりも表現に関するものであることに注意してください。通常、ARIMAモデルをARモデルに再配置できます。できない場合は、推定の問題が発生すると思います(非可逆時系列モデルが適合しにくいと確信しています)。また、相違点の多くは、モデルではなく用語に多くあります。条件付きランダムフィールドは、基本的に混合モデルです。隠れマルコフモデルは、などなど、カルマン・フィルタと非常によく似ています
probabilityislogic

@probabilityislogicコメントありがとうございます。はい、共通点はたくさんあります。実際には、統計的アプローチ全体が機械学習と同じであり、単にいくつかの新しい方法と同じであると言うのは、私にとって非常に魅力的です。そのような場合に重要なことを見逃してしまうのではないかと恐れているので、違いに集中して、これらのモデルを適用する正しい方法と間違った方法の詳細を理解しています。私は類似点を見るのは簡単ですが、見逃すのが怖い違いです。
GreyR

回答:


1

質問1に関して、時系列はランダムウォークを主に扱いません。定常時系列には、たとえばARMAモデルなどでモデル化された相関構造があります。時系列分析では、定期的な影響と傾向も調べます(これらの時系列を非定常と呼びます)。データ内のパターンの検索は、パターン+ランダムコンポーネントがあり、ランダムコンポーネントを分析で考慮する必要があるという認識がある限り、統計と互換性がありません。質問2について、なぜTARを機械学習と統計の混合と呼ぶのかわかりません。しきい値パラメーターと2つのARモデルを含む、より複雑な時系列モデルと見なします。また、機械学習と統計の間に大きな違いはないと思います。私は、機械学習を、多変量解析の領域に該当する統計的パターン認識/分類の一部と見なしています。TARはARMAモデルにしきい値を設定するように簡単に拡張できるように思えます。試されたかどうか、なぜ開発されなかったのかはわかりません。おそらく、これらのタイプの時系列モデルを扱う誰かがその質問に答えることができます。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.