私のウェブサイトはGoogleウェブスパイダーによってDoSされています。Googleはサイトのインデックス登録を歓迎しますが、ウェブサーバーが結果を生成するよりも速くサイト上のタグクラウドにクエリを実行し、ウェブサーバーのリソースを使い果たすことがあります。
通常の訪問者が影響を受けないようにWebサーバーへのアクセスを制限するにはどうすればよいですか?
robots.txtは、サイト全体のインデックス作成をブロックするため、オプションではありません。
iptables -m recent
一部のページには多くの画像やその他のデータファイルがあり、それらにも「最近」のトリガーがあるため(通常、私のRSSアグリゲーター、画像とフィードの読み込み)、トリッキーです。
iptables -m limit
同じ欠点があり、それに加えて、IP送信元アドレスごとに選択することができませんでした。
サーバーの負荷が高くなりすぎる訪問者を制限するにはどうすればよいですか?
私はVirtualBox VMのUbuntuサーバーでapache2を実行しています。
1
ウェブマスターツールを使用して、クロール頻度を下げることができます。support.google.com/webmasters/bin/…を
—
derobert