正確な答えはわかりません。おそらくGoogle以外の人は知りません。しかし、私は2つのデータポイントを持っています。
最初の問題は、XKCDの問題に対する見方です。
そのため、Googleは明らかに「それをねじ込んで」と言って巨大な数値をスローする結果ボリュームの特定のしきい値があるように見えます。これはおそらく、意図的な欺瞞ではなく無能によるものだと思います。多くのソースからすばやくページを生成するのは難しいと思います。おそらく、多くの結果が得られた検索の場合、すべてを同期させる時間はありません。だから彼らは数字をごまかす。これが彼らが彼らよりもはるかに多くの結果を持っているように見えるという事実は、おそらく単なる意図しないボーナスです。
2番目のデータポイントは、この問題に非常に興味があり、Googleの何人かの友人を悩ませていた私がいたコンピュータサイエンスの教授からのものです。彼らは、検索から実際に返された結果の数を把握することは非常に高価になることがあるので、彼らは最善の推測をして結果の最初のページを返すだけだと彼に言いました。実際にページのドリルダウンを開始したときのみ、Googleは残りのページを完全に計算する必要はありません。
したがって、どちらも決定的な答えではありませんが、うまくいけば、Googleの不正確さを引き起こしている可能性のある問題の種類を説明するのに役立つでしょう。
編集:
このページの Sathyaの回答には、GoogleのウェブマスターKB からの回答があります。
検索を実行すると、多くの場合、結果とともに次の情報が表示されます:XXXXについての結果1-10。
検索結果の総数のGoogleの計算は推定です。おおよその数値は価値があると理解しています。正確なアカウントではなく見積もりを提供することで、質の高い検索結果をより早く返すことができます。
また、検索結果の次のページをクリックすると、検索結果の総数が変わる場合があります。この場合、クエリ結果の一部が重複していることがわかり、それらの重複を折りたたむことで、探している特定の結果をより簡単に見つけることができます。複製を折りたたむと、結果の推定数が減少し、結果ページの総数も減少します。