サイトに次のrobots.txtファイルを使用しています。ターゲットは、googlebotとbingbotがページ以外のサイトにアクセスできる/bedven/bedrijf/*
ようにし、他のすべてのボットがサイトをクロールできないようにすることです。
User-agent: googlebot
Disallow: /bedven/bedrijf/*
Crawl-delay: 10
User-agent: google
Disallow: /bedven/bedrijf/*
Crawl-delay: 10
User-agent: bingbot
Disallow: /bedven/bedrijf/*
Crawl-delay: 10
User-agent: bing
Disallow: /bedven/bedrijf/*
Crawl-delay: 10
User-agent: *
Disallow: /
最後のルールではUser-agent: * Disallow: /
、すべてのボットがサイトのすべてのページをクロールすることを禁止していますか?
robots.txt
とにかく完全に無視することができます
robots.txt
または少なくともDisallow: /
ルールに従う、行儀の悪いボットの不足はありません。ボットプログラマーがサーバーが256 kbit接続の間違った端にあるRaspberry Piであるとは決して考えなかったために、個人のWebサイトが地面に打ち込まれている場合は、このような包括的な除外が役立ちます。