Facebookの預言者は線形回帰と何が違うのですか?


11

Facebookの預言者について私が読んだのは、時系列を基本的にトレンドと季節性に分解することです。たとえば、加法モデルは次のように記述されます。

y(t)=g(t)+s(t)+h(t)+et

  • t時間を
  • g(t)トレンド(線形またはロジスティック)
  • s(t)季節性(毎日、毎週、毎年...)
  • h(t)休日
  • etエラー

私の質問は次のとおりです。単純な線形回帰でそれを行うことはできませんか?それらを比較すると、結果の点でどのような違いがありますか、そしてなぜですか?


はい、線形モデルでこれを行うことができます。私は預言者を知りませんが、これがすべてである場合、違いはありません。
user2974951

回答:


13

ここでの問題は、観測されたデータを解析して信号とノイズに変換する方程式を取得することです。データが単純な場合、回帰アプローチが機能する可能性があります。彼らが預言者に対して行っている仮定のいくつかを理解するように注意する必要があります。Prophetは単純なモデルに適合するだけでなく、構造を追加しようとするため、Prophetの機能をよりよく理解する必要があります。

たとえば、よく書かれた紹介を読んだ後に私が行ったいくつかの考察は、あなたの評価に役立つかもしれません。彼らのアプローチを誤解している場合は、事前に謝罪し、そうである場合は是正したいと思います。

1)彼らのリードの例にはトレンドの2つのブレークポイントがありますが、最も明白なものだけをキャプチャしました。

2)彼らは、予測を導くために省略された確率系列またはYの履歴値を使用することの価値を反映するすべてのARIMA構造を無視します。

3)それらは、ユーザーが提案した確率的および決定論的系列の可能なダイナミクス(リードおよびラグ効果)を無視します。預言者の因果関係の回帰効果は単に同時期のものです。

4)シリーズまたは季節的パルスのステップ/レベルの変化、たとえば、未知の外部イベントによる時間の途中での月曜日の効果の変化を特定する試みは行われません。Prophetは、代替の可能性を検証することによって検証するのではなく、「単純な線形成長」を前提としています。この可能な例については、Facebook ProphetとRを使用したオンラインサブスクリプションビジネスの定期注文の予測を参照してください。

5)正弦と余弦は、季節性を処理する不透明な方法ですが、曜日、月、週、月などの季節効果は人為的(人間を扱う!)効果を扱う場合、はるかに効果的/有益です。

毎年のパターンに対して365.25の頻度を提案することは、私たちが昨年とまったく同じ日に同じアクションを実行しないのでほとんど意味がありませんが、月次活動ははるかに永続的ですが、預言者は11の月次指標を提供しないようですオプション。毎週52週というのは、毎年52週がないため、意味がありません。

6)エラープロセスがガウスであることを検証する試みは行われないため、有意義な意味のあるテストを行うことができます。

7)モデルの誤差分散が均一であること、つまり、重み付き最小二乗を示唆する特定の時点で決定論的に変化しないことについての懸念はありません。期待値に比例するエラー分散を処理するために最適なパワー変換を見つけることについての懸念はありません(いつ(そしてなぜ)分布(対数)の対数を取る必要があるか?

8)ユーザーは、イベント/休日に関するすべての可能なリードおよびラグの影響を事前に指定する必要があります。たとえば、クリスマスの長期的な影響を反映して、11月下旬に毎日の売り上げが増加し始めることがよくあります。

9)結果として生じるエラーが十分なものであるかどうかの診断チェックを介してモデルを改善する方法を示唆する構造がないという心配はありません。

10)重要ではない構造を削除することによるモデルの改善については、どうやら心配はありません。

11)可能性のある異常を考慮してモデルのエラーをブートストラップすることで信頼限界が必ずしも対称的でない場合がある、シミュレートされた予測のファミリを取得する機能はありません。

12)ユーザーがトレンド(トレンドブレークポイントの数と実際のブレークポイントの数)を想定できるようにすることで、ハンズフリーの大規模アプリケーション向けに設計された大規模分析に直面して、不要または使用できない柔軟性が可能になります。


同意しますが、それらは「持っているのが良い」機能に近く、「持っている必要がある」機能に近いと思います。あなたはそれらのいくつかを欠いている高品質の予測モデルを持つことができます。しかし、私が言ったように、良い点と素晴らしいレビュー。
Tim

あなたはあなたの反射でかなり正しいです...「データ」の固有の複雑さは支配問題です。単純なデータは、単純なソリューションが必要です..複雑なデータは、「持っているのがいい」が「持っている必要がある」になる可能性があることを示唆しています。あなたのデータだけが確実に知っています!Occamのかみそりが頭に浮かぶ..
IrishStat

@ Timstats.stackexchange.com / questions / 417908 / スレッドは、「単純な線形トレンド」などの不適切な仮定を無効にするために、実際に「持っている必要がある」いくつかの機能が「持っている必要がある」必要があることを示唆しています。
IrishStat

10

私はそれを使用していませんが、これは彼らのプレプリントの要約です(私の強調):

予測は、組織のキャパシティプランニング、目標設定、異常検出を支援する一般的なデータサイエンスタスクです。その重要性にもかかわらず、信頼性の高い高品質の予測の作成には重大な課題があります。特に、さまざまな時系列があり、時系列モデリングの専門知識を持つアナリストが比較的まれである場合です。これらの課題に対処するため、構成可能なモデルとアナリストインザループパフォーマンス分析を組み合わせた「大規模な」予測への実用的なアプローチについて説明します。時系列に関するドメインの知識を持つアナリストが直感的に調整できる解釈可能なパラメーターを持つモジュラー回帰モデルを提案します。予測手順を比較および評価するためのパフォーマンス分析について説明し、手動による確認と調整のために予測に自動的にフラグを付けます。アナリストが専門知識を最も効果的に使用できるようにするツールは、ビジネスの時系列の信頼できる実用的な予測を可能にします。

はじめに:

業績予測を作成する上で、2つの主要なテーマを確認しました。まず、完全に自動化された予測手法は調整が難しく、柔軟性が高すぎて、有用な仮定やヒューリスティックを組み込むことができない場合があります。第2に、組織全体のデータサイエンスタスクを担当するアナリストは、通常、サポートする特定の製品またはサービスに関する深い専門知識を持っていますが、時系列予測のトレーニングを受けていないことがよくあります。

したがって、ここでは統計的に大幅進歩を遂げたと主張しているわけではないようです(ただし、概要を説明する単純なモデルよりはるかに多くのことが可能です)。代わりに、彼らのシステムは、時系列分析の専門知識を持たない多数の人々が、独自のドメインの専門知識とシステム固有の制約を適用しながら予測を生成することを実現可能にすると主張しています。

時系列分析と複雑なモデルのコーディングの両方の専門知識をすでに持っている場合、これはあまり役に立ちません。しかし、彼らの主張が真実であれば、これは非常に役立つかもしれません!科学(および商業)は、新しいアイデアのためだけでなく、新しいツールとその普及のためにも進歩しています(このトピックとこの応答についてのこの短いフリーマンダイソンの作品を参照してください)。

統計そのものから例をとると、R統計の進歩を表すものではありませんでしたが、より多くの人々が統計分析を行うことが容易になったため、非常に影響力がありました。これは足場であり、多くの統計的理解が築かれています。運が良ければ、預言者も同様の役割を果たすかもしれません。

ダイソン、フリーマンJ.「科学は主にアイデアやツールによって推進されているのか?」サイエンス338、いいえ。6113(2012):1426-1427。


0

線形モデルで実装できる変化点である区分線形スプラインがありません。

少なくとも、限定的なケースでは、線形正則回帰(L1およびL2正則化)であることに間違いはありません。

別の預言者モデル、ロジスティック成長があることに注意してください。

また、季節的要因は相加的であると想定していますが、少なくとも成長モデルではより自然に見える乗法的季節効果もサポートしています。


ログを取るという預言者の仮定は、この貴重な議論に直面して飛んでいきます... stats.stackexchange.com/questions/18844/…電力変換は、期待値とモデルエラー分散または特定の値の間の経験的関係に基づいて正当化されますドメイン知識に基づく非線形推定。
IrishStat

@IrishStatその点をありがとう(乗算変換の季節性を実装するために対数変換を忘れていたため、STANを使用しているため、対数を取る代わりに非線形モデルを使用できたはずです)。乗法的季節性の仮定と「非線形推定..」の違いを説明できますか
seanv507

@whuberの回答stats.stackexchange.com/questions/298/を見ると、ドメインの知識に基づいた非線形の仮定である可能性がある「科学理論が示す場合」に変換を提案しています。経験的電力変換は、エラーの分散が期待値に比例していることが判明した場合に役立ちます。そうでない場合は、単に「ウィンドウドレッシング」になる可能性があります。
IrishStat

0

単純な線形回帰で多くのことを行うことができますが、Prophetができることはすべてではありません。ほんの一例として、トレンドの変化点候補を独自に指定すると、Prophetはそれを事前に使用します。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.