Auto.arimaとautoboxは違いますか?


16

このサイト上の記事を読んでから私はRのあることがわかっている機能 auto.arima(でforecast パッケージが)。また、私はことを知ってIrishStat、このサイトのメンバーは、商用パッケージ建てでAutoBoxを 1980年代初頭に。これらの2つのパッケージは現在存在し、特定のデータセットに対してarimaモデルを自動的に選択するため、これらのパッケージはどのように異なるのですか?同じデータセットに対して異なるモデルを作成する可能性はありますか?


@Wayneを編集してくれてありがとう。私はR予測パッケージに慣れていませんが、それがオートボックスと比較することを意味していると確信しています。
マイケルR.チャーニック

(「auto-arima」を「auto.arima」に少し変更しました。)auto.arima他のパッケージには他の機能があるかもしれませんが、間違いなく1つありますforecast。その説明は次のとおりです。 AIC、AICc、BICのいずれかの値に変換されます。この関数は、指定された順序制約内で可能なモデルを検索します。」
ウェイン

1
AUTOBOXは、識別可能な構造のないエラープロセスを持ちながら、統計的に有意なパラメーターのみを持つモデルをレンダリングするために、実際に推定して診断のステップアップおよびステップダウン手順を実行することにより自動識別を反復することにより、全体的な方法で自動識別を扱いますこのようにして、反復のスクリプトに従います。1975年頃のAUTOBOXの初期バージョンは「1つの統計的アプローチ」を使用しようとしましたが、特定のモデルが冗長または馬鹿げた構造(5,1,2など)または明らかに不十分な構造を持っていることが望まれました。
IrishStat

1
@IrishStatそれは良いアプローチのように聞こえます。要件を満たす2つの競合モデルを見つけた場合はどうしますか。可能性があります。特定の基準に基づいて「最適な」モデルを推奨しますか?「統計的に有意なパラメーター」のみのモデルを選ぶことは、par約を好む傾向があることを認識していますが、低パラメーターのARプロセスと、すべてのパラメーターが統計的に有意で残差が白く見える別の低次AEMAモデルを持つことはできませんノイズ?
マイケルR.チャーニック

1
@IriehStat。仰るとおりです。最後に、ユーザーに対して何をしますか。モデルを1つだけ提供しますか、または競合する許容可能なモデルの順序付きリストを提供しますか?そうでない場合は、リストを小さな数に制限する場所を追加するのに適したオプションになるでしょう。
マイケルR.チャーニック

回答:


9

マイケル/ウェイン

AUTOBOXは、以下の条件の1つ以上が満たされた場合、異なるモデルを確実に配信/識別します。

1)データにパルスがあります

2)データに1つ以上のレベル/ステップシフトがある

3)データに季節的なパルスがある場合

4)データに1つ以上の現地時間の傾向がありますが、それらは単に修正されません

5)モデルのパラメーターが時間とともに変化する場合

6)エラーの分散が時間とともに変化し、電力変換が適切でない場合。

特定の例については、両方のユーザーが時系列を選択/作成し、両方をWebに投稿することをお勧めします。AUTOBOXを使用して無人モードでデータを分析し、モデルをリストに投稿します。次に、Rプログラムを実行してから、それぞれの結果の個別の客観的分析を行い、類似点と相違点を指摘します。私のコメントのために、最終的なエラー条件を含め、利用可能なすべてのサポート資料が揃ったこれらの2つのモデルを送ってください。これらの結果を要約してリストに提示し、リストの読者に、どの手順が彼らにとって最適だと思われるか投票してもらいます。


このようなコンテストですか?
whuber

@whuberはい。おそらく、背景として使用できる「不明/コード化されたテキストの例」を使用することもあります。
IrishStat

22

それらは、2つの類似した異なる問題に対する2つの異なるアプローチを表しています。私が書いてauto.arima、@ IrishStatはの著者ですAutobox

auto.arima()ドリフト項を含む(季節的な)ARIMAモデルに適合します。Autobox伝達関数モデルに適合して、レベルシフトと外れ値を処理します。ARIMAモデルは、伝達関数モデルの特殊なケースです。

でレベルシフトと異常値の検出をオフにした場合でも、ARIMAパラメーターの識別方法が異なるAutoboxため、異なるARIMAモデルが取得auto.arima()されます。

M3およびM競合データのテストでは、これらのデータauto.arima()よりも正確な予測が生成さAutoboxれます。ただし、Autobox主要な外れ値とレベルシフトを含むデータの方がうまくいきます。


3
あなたは、何年も前のAUTOBOXのバージョンについて言及していたと思います。AUTOBOXはここ数年で大きく変化しました。私が間違っていない場合、1の起源からの正確さだけを比較します。これは1のサンプルであることに同意します。正確さは多くの起源から評価する必要があります。
IrishStat

15
私は数千のシリーズにわたる公開された比較に言及しています。International Journal of Forecastingの編集長として、予測を評価する方法についていくつかの考えを持っていると思います。
ロブハインドマン

2
私は、この質問が誰が最良の予測アルゴリズムを持っているかについて議論することを意図していませんでした。autoboxとauto.arimaはおそらく非常に良いパッケージだと思います。直接比較は、多くの理由で公平ではないかもしれません。1)ユーザーは、それらを判断する方法を十分に理解していない場合があります。2)単一の時系列での予測精度は、がらくたショットです。予測の平均二乗誤差は小さいかもしれませんが、ランダム性が関係する場合は常にそれを考慮に入れる必要があります。いくつかのシリーズを見る必要があり、IrishStatが示唆しているように、異なる開始点を見る必要があります。
マイケルR.チャーニック

また、予測を開始するさまざまなポイントが役立ちます。3)ARIMAの世界では、同じ時系列モデルに複数の表現があり、有限ARプロセスには無限の移動平均表現があり、逆も同様です。したがって、低次のARは、高次の移動平均またはARMAとほぼ同じです。Boxは常に節約の原則に従うことを提案しました。ただし、大量のデータがある場合は、パラメーターの適切な推定値を取得でき、高次モデルは、par約的な予測とほぼ同じ予測を生成する可能性があります。4)2つのパッケージの目的は異なります。
マイケルR.チャーニック

3
この方法は時間とともに進化してきました。Dave ReillyはIrishStatとしてこのサイトで非常に積極的であり、一般的な用語でそれがどのように機能するかを説明することに非常にオープンです。営業秘密と独自のアルゴリズムを持つことは、ビジネスの重要な側面です。彼の観点から、RはSPlusの場合と同じようにビジネスを傷つけています。しかし、彼は苦味を示さず、今日あなたが見たように、彼のソフトウェアを非常に喜んで示しています。彼はまた、競合他社に対してテストを実行することをいとわず、彼は時系列予測コンテストに参加したと思います。
マイケルR.チャーニック

11

編集:あなたのコメントによると、私はあなたが多くautoboxのオプションをオフにすると、おそらく同様の答えを得ると信じていますauto.arima。しかし、そうしないと、外れ値が存在する場合には間違いなく違いがあります:auto.arima外れ値を気にせず、autoboxそれらを検出して適切に処理するため、より良いモデルが得られます。他にも違いがあるかもしれません。IrishStatがそれらを説明できると確信しています。


autobox最良のAR、I、およびMA係数を検索するだけでなく、外れ値やその他のものを検出すると考えています。それが正しい場合、同様の機能を使用するには、さらに分析と他のR関数がいくつか必要になります。IrishStatsはこのコミュニティの貴重なメンバーであり、非常に友好的です。

もちろん、Rは無料であり、ARIMAを超える膨大なことを実行できます。

経済学スタイルのARIMAに無料で提供されているもう1つの選択肢はX13-ARIMA SEATS、米国国勢調査局のオープンソースです。WindowsとLinux用のバイナリがありますが、gnuのgfortranコンパイラをすでにロードしているので、Macで簡単にコンパイルできます。これはの後継X12-ARIMAであり、長年の開発とテストの後、ここ数日でリリースされたばかりです。(X12を更新し、SEATS / TRAMO機能も追加します。X12は米国の公式ツールですが、SEATS / TRAMOはスペイン銀行の「ヨーロッパツール」です。)

私はX12(そして現在X13)が大好きです。かなりの量の診断結果を出力し、それらを読み通して、それらの意味を学ぶと、実際にはARIMAと時系列のかなり良い教育になります。独自のワークフローを開発しましたが、R x12内からほとんどの作業を行うためのRパッケージがあります(X12用の入力モデル( ".spc")ファイルを作成する必要があります)。

X12は「経済学スタイル」のARIMAが得意であり、3年以上のデータを持つ月次データを意味します。(いくつかの診断機能を使用するには5年以上のデータが必要です。)異常値の識別機能があり、あらゆる種類の異常値の仕様を処理でき、休日、変動休日、取引日の影響、および多くの経済的な事柄を処理できます。これは、米国政府が季節調整済みデータを作成するために使用するツールです。


私の質問には、2つのアルゴリズムが異なるモデル選択を生成する可能性のあるデータセットが実際に与えられました。私が興味を持っているのは実際に自動選択であり、他の診断機能ではなく、他の診断機能はありません。ARMAモデルのファミリーとそのファミリーの2つのモデルは、同じモデルの正確な、またはほぼ正確な代替表現であることが知られています。したがって、選択手順にわずかな違いがある場合、異なるモデルの選択肢を与えることができると思います。
マイケルR.チャーニック

3
@MichaelChernick:ああ。私の推測では、すべての自動機能をオフにautoboxすると、同じ答えが得られるでしょう。しかし、使用するポイントの1つは、autobox外れ値を検出してそのように処理することです。そのため、外れ値がある場合、返されるモデルは異なります。
ウェイン

X13-ARIMA SEATSおよびSEATS / TRAMOに関する追加情報については、@ Wayne +1。
グレアムウォルシュ

@Wayneところで、もう1つの「ヨーロッパツール」はDEMETRA +です。
グレアムウォルシュ
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.