まず、それは単なるごまかしであり、間違っています。Googleには、非常に才能のある統計学者、情報検索の専門家、言語学者、経済学者、心理学者などがいます。これらの人々は多くの時間を費やして、相関関係と因果関係の違いについて多くの非統計学者を教育しています。大規模な組織であることを考えると、無知なポケットもあれば、大きなポケットもあるかもしれませんが、その主張は間違いです。さらに、その教育の多くは顧客、特に広告主に直面しています。
より深い答え:違いは非常に重要です。検索結果のランキングを見て、「相関」だけでなく、類似性の尺度、スコアリング関数などを含めることもできます。一部のページは、特定のクエリに対して良好な結果になるように測定されます。これらには、ランキングに重要なさまざまな予測機能があります。クエリに対して良い結果をもたらすこれらの優れたページとは対照的に、同じクエリに対して非常に悪い結果をもたらすページであるWebページのセットがあります。ただし、それらのページの作成者は、良いページのように見せるために多くの努力を費やします、数値の観点からます、テキスト一致、インターネットリンケージなど。ただし、これらのページが数値的に「良い」ページと「類似」しているからといって、これらが実際に良いページであることを意味するわけではありません。そのため、Googleは、妥当な機能が(別々の)良いページと悪いページを区別するものを決定するために多大な労力を費やしており、これからも努力を続けます。
これは完全な相関関係と因果関係ではありませんが、それよりも深いものです。特定のクエリに適したページは、多くの無関係なページまたは悪いページと類似しており、異なるように見える数値空間にマッピングされますが、結果が機能空間の同じ領域にあるからといって、同じ「高品質」サブセットに由来することを意味しませんウェブの。
より単純な答え:非常に単純な視点は、結果のランキングに対処することです。最良の結果が最初であるべきですが、何かが最初にランク付けされているからといって、それが最良の結果であるとは限りません。スコアリングのいくつかの測定基準により、Googleのランキングは品質評価の黄金の基準と相関していることがわかりますが、それはランキングが結果が品質と関連性の点で本当にこの順序であることを意味するわけではありません。
更新(3番目の回答):時間が経つにつれて、私たち全員に影響を与える別の側面があります。それは、Googleの上位の結果であるため、上位のGoogleの結果が信頼できると見なされる可能性があるということです。リンク分析(たとえば、 "PageRank"-リンク分析の1つの方法)は、認知された信頼性を反映する試みですが、時間の経過とともに、トピックの新しいページは単にGoogleの上位結果にリンクすることで、そのリンク構造を強化する可能性があります。より信頼性の高い新しいページには、最初の結果と比較してヘッドスタートに問題があります。Googleは現在、最も関連性の高いページを配信したいと考えているため、いわゆる「リッチゲットリッチャー」現象を含むさまざまな要因が、認識された因果関係の暗黙的な影響により発生します。
更新(4番目の回答):プラトンの洞窟のアレゴリーを読んで、現実と方法の「反射/投影」の結果として相関関係と因果関係を解釈する方法の感覚を得ることが役立つかもしれないことに気付きました(以下のコメントについて)私たち(または私たちのマシン)はそれを知覚します。ピアソンの相関に厳密に限定された相関は、誤解の関連付け(単なる相関よりも広い)と因果関係の問題の解釈としてはあまりにも限定的です。