これまでの回答は、データ自体に焦点を当ててきました。データ自体は、これが存在するサイトとその欠陥に関して理にかなっています。
しかし、私は傾向から計算/数学の疫学者なので、議論にも関連しているため、モデル自体についても少しお話しします。
私の考えでは、論文の最大の問題はGoogleデータではありません。疫学の数学モデルは常に乱雑なデータを処理しますが、私の考えでは、この問題はかなり単純な感度分析で対処できます。
私にとって最大の問題は、研究者たちが「成功へと落ち込んだ」ことです。これは、研究では常に避けるべきものです。データに適合させることにしたモデル、つまり標準のSIRモデルでこれを行います。
簡単に言えば、SIRモデル(感染性(S)感染(I)回復(R)を表す)は、感染症を経験した集団の健康状態を追跡する一連の微分方程式です。感染した個人は、影響を受けやすい個人とやり取りして感染し、その後、回復したカテゴリに進みます。
これにより、次のような曲線が生成されます。
美しいですね。はい、これはゾンビの流行です。長い話。
この場合、赤い線は「Facebookユーザー」としてモデル化されているものです。問題はこれです:
基本的なSIRモデルでは、Iクラスは最終的に、そして必然的に、漸近的にゼロに近づきます。
それは起こらなければなりません。ゾンビ、はしか、Facebook、またはStack Exchangeなどをモデル化するかどうかは関係ありません。SIRモデルでモデル化する場合、必然的な結論は、感染性(I)クラスの人口がほぼゼロになることです。
SIRモデルには非常に簡単な拡張機能があり、これは真実ではありません。回復した(R)クラスの人々を影響を受けやすい(S)に戻すことができます(本質的に、これはFacebookを「私は「いつか戻ってくるかもしれない」に戻ることはありません)、または新しい人々を人口に入れることができます(これは、ティミーとクレアが最初のコンピューターを手に入れることになるでしょう)。
残念ながら、著者はそれらのモデルに適合しませんでした。ちなみに、これは数学的モデリングにおける広範な問題です。統計モデルは、変数のパターンとデータ内のそれらの相互作用を記述するための試みです。数学モデルは現実に関する主張です。SIRモデルを取得して多くのものに適合させることができますが、SIRモデルの選択はシステムに関する主張でもあります。つまり、いったんピークに達すると、ゼロに向かっています。
ちなみに、インターネット企業は、流行モデルに非常によく似たユーザー保持モデルを使用していますが、それらは、論文で提示されているものよりもかなり複雑です。