なぜ私がこれらの愚かな質問をするのかを説明するために、以下で見つけることができます。私はより機械学習の人であると言わなければなりません。私はバイオインフォマティクスの問題に取り組みましたが、すべてが順調でした。「回帰」や「尖度とゆがみ」などの言葉を聞いたとき、最初は微笑んだだけで、2番目のケースは「はい、聞いたことがある。それを計算する方法を知っていますが、なぜ地球上で誰もがそれを必要とするのですか?」
1年前の状況は劇的に変化しました。楽しみのために、機械学習の知識をいくつかの財務時系列に適用しようとしました。
「テクニカル」「分析」「指標」から提供される信号からベイジアンネットワークを作成することから始めました。アイデアは失敗しました。また、このサイト(ベイジアンの代わりにニューラルネットワークを使用)で同様のアイデアを持つ少なくとも2つのトピックを見つけることは、いくらか喜ばしいことでした。
次に、多くの努力の結果、kNNとシンボリック回帰の混合を構築することができました。これは、2000年から2006年までの1時間のデータでトレーニングし、2007年のデータでテストしました。しかし、それを最新のデータに適用すると、経済の急激な変化により精度が大幅に低下し、市場で何かが変化し、2-5でしか取得できない新しいデータが必要になったため、精度が低下していることに気付きました。年。
後で、たくさんのことを試しましたが、もしこのすべてが「ただの楽しみ」として始まったとしたら、それはもう楽しくありませんでした。私がARIMA、GARCH、TARやその他のまったく新しいものについてRuey S. Tsayのオンライン講義を見つけるまでは。
基本的に私は全く新しい世界を見つけ、それを本当に楽しんでいます。現在、私は最初のARIMAモデルに適合させることができました。次に、ACF、PACF、季節性などを検討することにより、rms-errorを2回削減するように調整しました。
さて、楽しみは戻ってきました、私はそれをたくさん持っていました、そして私はもっと持っていると期待しています しかし、いくつか質問があり、この素晴らしいサイトを見つけました。ここでは、ARIMAとその他の関連技術に関するほぼすべてのトピックを読み、同様のアプローチに関連する他の多くの一般的なトピックも読んでください。確かにもっと読むでしょう。私はまだ機械学習アプローチの考え方の枠内で考えています。それは多くの愚かな質問につながり、そのほとんどはこのサイトで答えを見つけます。
だから、この長い紹介の後に、私の残りの愚かな質問があります:
機械学習アプローチはデータ内の「パターン」を見つけることについてより関心がありますが、ランダムウォーク理論を広く使用する金融時系列の統計モデル(パターンの存在を少なくとも疑わしくします)と矛盾します。非常にナイーブで誤った説明ですが、私が言いたいのは、ほとんどの機械学習手法は、問題に対する統計的アプローチと概念的に矛盾しているということです。いくつかのアプローチの方が優れていると言っているのではなく、矛盾していると言っているだけです。それは正しいですか、この矛盾はどのくらい大きいですか?
機械学習と統計の融合のように見えるTARモデルの説明とアイデアが本当に気に入りました。これは、ARIMAにGARCHを追加した後で次に試してみたいモデルです。しかし、私はそれについていくつか質問があります:
TARは統計的手法と機械学習手法の両方を使用しています。それで、私の最初の質問を念頭に置いて、モデルのセットのパターンを見つけようとすると、基本的にパターンを除外する理論に基づいて構築されていますが、エラーはありませんか?または、同じ問題のさまざまな側面を研究する2つのモデルを1つのさらに強力なモデルに結合する方法の単なるアイデアですか?
このサイトで「ARIMA」というキーワードで検索すると、15ページのトピックが表示されますが、TARの場合は1つしかありません。また、なぜARの適用をやめたのですか?このアイデアをより複雑なモデル(ARIMAなど)に拡張してみませんか?TARがARに対して期待された改善を提供しなかったからでしょうか?
MCMCの手法やその他の機械学習の要素が現在統計モデルと混合されていることを知っています。個人的には、隠れマルコフモデルと条件付きランダムフィールドの大ファンでもあります。これらの方法と統計モデルの混合について知っていますか?