http://www.useragentstring.com/pages/useragentstring.php?typ=Browserのリストによると、さまざまなブラウザからの9000以上のユーザーエージェント文字列があります。
- ブラウザの0ユーザーエージェント文字列に「bot」という単語が含まれています
- ブラウザの2つのユーザーエージェント文字列に「クロール」という単語が含まれている
- ブラウザの0ユーザーエージェント文字列に「スパイダー」という単語が含まれている
(「クロール」を含む2つは次のとおりです:「Mozilla / 4.0(互換性; MSIE 5.01; Windows NT 5.0; YComp 5.0.2.6; MSIECrawler)」および「Mozilla / 4.0(互換性; MSIE 5.01; Windows NT 5.0; MSIECrawler ) "それらを考慮しない方が安全だと思います。)
http://www.useragentstring.com/pages/useragentstring.php?typ=Crawlerのリストによると、ボットとして442のユーザーエージェント文字列がリストされています。
- ボットの208個のユーザーエージェント文字列に「bot」という単語が含まれています
- ボットの63個のユーザーエージェント文字列に「クロール」という単語が含まれています
- ボットの37個のユーザーエージェント文字列に「スパイダー」という単語が含まれています
- ボットの282ユーザーエージェント文字列には、「bot」、「crawl」、または「spider」のいずれかが含まれます
私の結論:「bot」、「crawl」、「spider」という単語を使用して、ユーザーエージェント文字列でボットをフィルタリングしても安全です。防弾ではありませんが、何もないよりはましです。
注:キーワードの検索では、大文字と小文字を区別しない検索を使用しました。
bot
、crawl
、spider
、とさえsearch
。