母は、ある種の司書になるためにオンラインコースを受講しています。このコースでは、ブール検索を扱っているため、データベースを効率的に検索できますが、次のような質問がありました。
「x OR y」を検索すると、105 000ヒットになりますが、xのみを検索すると80 000ヒットになり、yのみを検索すると35 000ヒットになります。個々の検索を組み合わせて115 000ヒットするのに、なぜ検索 "x OR y"は105 000ヒットするのですか?
私にとってこれは奇妙に聞こえたので、baconとsandwichという言葉を使って自分でテストしました。
- ベーコンのみが179 000 000の結果をもたらしました
- 312 000 000の結果が得られたのはサンドイッチのみ
- ベーコンORサンドイッチの結果は491 000 000でした
しかし、私にとっては、合計:179 000 000(ベーコン)+ 312 000 000(サンドイッチ)= 491 000 000(ベーコンまたはサンドイッチ)
ORクエリの結果、個々のクエリを両方組み合わせた場合よりもヒットが少ないのはなぜですか